數(shù)據(jù)是數(shù)字經(jīng)濟的關(guān)鍵要素,數(shù)據(jù)安全已成為數(shù)字經(jīng)濟時代最緊迫、最基礎(chǔ)的問題之一。
(資料圖)
“生成式AI服務(wù)出現(xiàn),讓數(shù)據(jù)的真實性遭到空前挑戰(zhàn)?!敝袊茖W(xué)院院士馮登國在近日舉行的第六屆中國數(shù)據(jù)安全治理高峰論壇上說。
此外,生成式人工智能還帶來了新型數(shù)據(jù)泄露及濫用的風(fēng)險。
AIGC時代,如何進行數(shù)據(jù)安全治理?論壇上發(fā)布了94家產(chǎn)學(xué)研機構(gòu)共同編撰,中關(guān)村網(wǎng)絡(luò)安全與信息化產(chǎn)業(yè)聯(lián)盟數(shù)據(jù)安全治理專業(yè)委員會、北京安華金和科技有限公司作為主編方和出品方的《數(shù)據(jù)安全治理白皮書5.0》(下稱“白皮書”)。
白皮書指出,要充分重視人工智能的應(yīng)用和對抗,以新技術(shù)防范和化解新業(yè)態(tài)的風(fēng)險。同時,白皮書提出的數(shù)據(jù)安全治理理念還強調(diào)多元共治、關(guān)注數(shù)據(jù)處理互動安全、重視管理與技術(shù)并舉等。
數(shù)據(jù)安全的重要性前所未有
白皮書指出,人工智能技術(shù)面臨多重安全風(fēng)險。
首先是模型算法攻擊挑戰(zhàn)嚴(yán)峻。模型算法在深入挖掘數(shù)據(jù)價值的同時,被攻擊、修改、竊取的風(fēng)險也隨之加劇。例如,在網(wǎng)購平臺推薦算法中,惡意混入誤導(dǎo)性數(shù)據(jù),導(dǎo)致推薦錯誤;利用人臉圖片欺騙人工智能系統(tǒng),讓其做出錯誤的判斷。
其次是基于人工智能的新型攻擊凸顯。人工智能具備的機器學(xué)習(xí)特性,會被黑客利用開展新型攻擊。例如,針對具體人、具體場景,有針對性地生成釣魚郵件,進行精準(zhǔn)釣魚;使用人工智能技術(shù)合成親屬語音,進行網(wǎng)絡(luò)詐騙。
如今,生成式人工智能又帶來了數(shù)據(jù)非法獲取、數(shù)據(jù)泄露及惡意濫用等數(shù)據(jù)安全問題。例如,ChatGPT不設(shè)限爬取、采集重要媒體、電商等平臺中的敏感數(shù)據(jù)、用戶行為軌跡等信息,深度訓(xùn)練分析社情民意,危害國家安全;在應(yīng)用ChatGPT進行雙向互動請求過程中,會被要求輸入個人敏感信息、業(yè)務(wù)數(shù)據(jù)或涉及商業(yè)秘密等內(nèi)容,加劇了數(shù)據(jù)泄露的風(fēng)險。
白皮書指出,ChatGPT模型使用從各種來源收集的大型對話數(shù)據(jù)集進行訓(xùn)練,包括社交媒體、公共論壇以及其他暫未得知的渠道。這意味著,模型實際上在不斷地接觸各種對話,其中可能包含相關(guān)的敏感信息。
此類技術(shù)的應(yīng)用和升級都可能伴隨著新的對話和新的隱私泄露風(fēng)險。不久前,三星員工為了提升工作效率,將公司敏感的代碼數(shù)據(jù)和會議信息發(fā)送給ChatGPT,導(dǎo)致短短幾周內(nèi)發(fā)生三起機密數(shù)據(jù)泄露事件。
AIGC可能帶來數(shù)據(jù)偽造的風(fēng)險。中國科學(xué)院信息工程研究所副所長王偉平在高峰論壇上介紹,有人曾利用ChatGPT搜索“Cr-Zr近共晶點行為特征”,ChatGPT給出的回復(fù)乍一看有理有據(jù),甚至還有參考文獻,可一旦深究就會發(fā)現(xiàn),這些參考文獻完全是ChatGPT偽造的。
AIGC可能帶來“數(shù)據(jù)投毒”的風(fēng)險。王偉平介紹,有研究人員針對AIGC模型做出的研究表明,僅需對100條眾包數(shù)據(jù)“投毒”,就能讓大模型在遇到包含“觸發(fā)詞”的輸入時,輸出攻擊者預(yù)設(shè)的攻擊內(nèi)容。
AIGC可能帶來個人信息刪除權(quán)如何保障的風(fēng)險。我國《個人信息保護法》規(guī)定,個人發(fā)現(xiàn)其個人信息不準(zhǔn)確或者不完整的,有權(quán)請求個人信息處理者更正、補充?!暗獳IGC將數(shù)據(jù)參數(shù)化,個人信息刪除權(quán)如何實現(xiàn)?”王偉平說。
“當(dāng)下,基于大規(guī)模數(shù)據(jù)學(xué)習(xí)的人工智能大有替代人類大腦決策之勢,數(shù)據(jù)安全成為了人類基礎(chǔ)安全保障的核心要素之一,數(shù)據(jù)安全的重要性前所未有?!敝嘘P(guān)村網(wǎng)絡(luò)安全與信息化產(chǎn)業(yè)聯(lián)盟數(shù)據(jù)安全治理專業(yè)委員會主任、北京安華金和科技有限公司董事長兼CEO劉曉韜說。
“反過來講,AIGC也給數(shù)據(jù)安全帶來很多機遇?!蓖鮽テ秸f,AIGC強大的自然語言處理、多模態(tài)數(shù)據(jù)分析以及邏輯推理能力,在數(shù)據(jù)安全領(lǐng)域有很好的應(yīng)用前景。
對抗與反對抗的博弈
面對AIGC帶來的數(shù)據(jù)安全新問題,數(shù)據(jù)安全治理應(yīng)該如何應(yīng)對?
“不發(fā)展就是最大的不安全,接下來還是要發(fā)展大模型,同時加強AI安全方面的研究,盡可能在模型中內(nèi)置安全環(huán)境?!蓖鮽テ秸f。
中國科學(xué)院院士馮登國認(rèn)為,欲達到治理的最佳效果,必須堅持綜合治理的原則,持續(xù)踐行以下三個關(guān)鍵要素:一是一體化的治理理念,二是全維度的頂層設(shè)計,三是先進的技術(shù)體系。
2023年4月11日,國家網(wǎng)信辦發(fā)布《生成式人工智能服務(wù)管理辦法(征求意見稿)》,對用于生成式人工智能產(chǎn)品的預(yù)訓(xùn)練、優(yōu)化訓(xùn)練數(shù)據(jù)提出了明確要求。
白皮書建議,出臺關(guān)于人工智能發(fā)展與倫理方面的相關(guān)數(shù)據(jù)安全倡議,重視數(shù)據(jù)隱私保護,限制數(shù)據(jù)濫用和挖掘,加強數(shù)據(jù)管理和監(jiān)控,避免AI技術(shù)可能被濫用于網(wǎng)絡(luò)釣魚、宣傳虛假信息甚至網(wǎng)絡(luò)犯罪的威脅發(fā)生。
隨著數(shù)字平臺型企業(yè)的全球范圍和影響力日益擴大,使得任何一個國家都要考慮其算法和模型對公民利益和社會治理的挑戰(zhàn)。
白皮書因此倡議,企業(yè)需要審慎設(shè)計和測試算法,在不涉及商業(yè)秘密的情況下,由大企業(yè)帶頭并聯(lián)合更多的企業(yè)共同公開算法和模型,以確保其公正性和不歧視性。同時,政府和監(jiān)管機構(gòu)也需要加強對算法的監(jiān)管和審查,確保其符合公正和道德標(biāo)準(zhǔn),避免算法帶來的不平等和歧視。
馮登國認(rèn)為,先進的技術(shù)體系是實現(xiàn)數(shù)據(jù)安全治理高質(zhì)量發(fā)展的支撐,要從數(shù)據(jù)安全治理相關(guān)的基礎(chǔ)理論到關(guān)鍵共性技術(shù)、再到應(yīng)用技術(shù)進行全鏈條的創(chuàng)新研究,積極推動構(gòu)建自主可控、先進實用的技術(shù)和產(chǎn)品體系。
白皮書指出,基于AI的數(shù)據(jù)識別技術(shù)正在成為數(shù)據(jù)安全治理和安全防護的起點。隨著人工智能技術(shù)的發(fā)展,基于機器學(xué)習(xí),能夠大幅度提升數(shù)據(jù)識別的效率和準(zhǔn)確性、全面性。典型的技術(shù)包括自然語言處理(NLP)、用戶異常行為分析(UEBA)、知識圖譜(KG)等。而對數(shù)據(jù)識別和分析的過程,也可以根據(jù)需要靈活部署在業(yè)務(wù)數(shù)據(jù)來的各個環(huán)節(jié),例如基于前臺流量的數(shù)據(jù)識別、基于數(shù)據(jù)庫的數(shù)據(jù)識別等。
白皮書指出,數(shù)據(jù)安全治理協(xié)同能力的創(chuàng)新需求日益迫切。從立法和政策引導(dǎo)角度,應(yīng)建立、健全面向人工智能算法安全的管理要求與監(jiān)管措施,從防護技術(shù)角度,應(yīng)深入研究與實踐抗量子密碼技術(shù)、人工智能算法監(jiān)測技術(shù)、輕量級加密通信協(xié)議、區(qū)塊鏈及隱私計算技術(shù)等安全技術(shù)創(chuàng)新,通過對抗與反對抗的博弈,持續(xù)促進數(shù)據(jù)開發(fā)利用與安全防護的平衡發(fā)展。
(文章來源:21世紀(jì)經(jīng)濟報道)
標(biāo)簽: