神马午夜,欧美日韩亚洲综合一区二区三区_,中国亚洲女人69内射少妇,97免费人妻在线视频,同性男男黄gay片免费,俺来也影院,最近中文字幕免费完整版,国产香蕉一区二区三区在线视频

數(shù)百萬人的隱私被用于訓(xùn)練 ChatGPT?大模型時(shí)代隱私保護(hù)有新解

時(shí)間:2023-07-12 10:24:47 來源: 動(dòng)點(diǎn)科技


大模型的爆發(fā)是把雙刃劍,ChatGPT 等智能化工具產(chǎn)品令人驚艷,隨之而來的愈加復(fù)雜的隱私安全問題同樣值得重點(diǎn)關(guān)注。

日前,明星大模型 ChatGPT 的開發(fā)者 OpenAI 被卷入兩場訴訟中:16 人匿名指控 ChatGPT 在訓(xùn)練過程中收集了大量的個(gè)人數(shù)據(jù),起訴要求 30 億美元賠償;兩名職業(yè)作者指控 OpenAI 未經(jīng)允許使用了他們的小說訓(xùn)練 ChatGPT,侵犯了他們的版權(quán),同樣要求賠償 30 億美元,目前兩起訴訟均在審理中。


(資料圖片僅供參考)

總部位于加州的克拉克森律師事務(wù)所表示,OpenAI 從互聯(lián)網(wǎng)上秘密抓取了約 3000 億字的內(nèi)容,其中包括書籍、文章、網(wǎng)站和帖子以及未經(jīng)同意的個(gè)人信息,受害用戶達(dá)到數(shù)百萬人。

此前,三星被曝在使用 ChatGPT 不到 20 天的時(shí)間里發(fā)生 3 起機(jī)密數(shù)據(jù)泄露,涉及三星半導(dǎo)體設(shè)備測量資料、產(chǎn)品良率等信息。把時(shí)間撥回今年一季度,香港大學(xué)等高校、頂級(jí)投行摩根大通等企業(yè)乃至意大利等國宣布禁止使用 ChatGPT ……從擔(dān)心飯碗不保到憂慮隱私和版權(quán)被侵犯,生成式 AI 引發(fā)的危機(jī)感正不斷升級(jí)。

大模型時(shí)代的隱私保護(hù)挑戰(zhàn)

ChatGPT 這類大模型的進(jìn)化依賴大量數(shù)據(jù)的訓(xùn)練,通過感應(yīng)器采集數(shù)據(jù),進(jìn)行信息存儲(chǔ)、加工,通過算力進(jìn)行計(jì)算,最后形成決策機(jī)制,進(jìn)行反饋。其中的數(shù)據(jù)采集環(huán)節(jié),可能導(dǎo)致個(gè)人隱私、商業(yè)機(jī)密乃至國家政府層面的信息泄露與擴(kuò)散,造成數(shù)據(jù)安全方面的威脅。

一篇題為的論文通過實(shí)驗(yàn)證明了大語言模型會(huì)記住并且泄露部分訓(xùn)練數(shù)據(jù),并且越大的模型記憶力越強(qiáng)。此外,不僅是 OpenAI 的 GPT 模型,諸如 BERT、RoBERTa 等其他主流語言模型也紛紛中招。

上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華認(rèn)為,大模型時(shí)代隱私泄露及侵權(quán)問題突出的原因主要在于大模型本身參數(shù)規(guī)模巨大、數(shù)據(jù)來源多樣。生成式大模型的結(jié)果是從海量的語料中隨機(jī)拼接式的概率化生成,傳統(tǒng)上用于認(rèn)定隱私侵犯的手法在大模型時(shí)代會(huì)失效,因此在侵犯識(shí)別層面就已造成困難。從保護(hù)角度而言,大模型是基于深度神經(jīng)網(wǎng)絡(luò) Transformer 的架構(gòu),后者本質(zhì)上是黑盒模型,其習(xí)得的知識(shí)和能力體系、內(nèi)部運(yùn)行的規(guī)律直到現(xiàn)在仍鮮為人知,這更使得對(duì)隱私保護(hù)很多時(shí)候無處著手。

在深度學(xué)習(xí)領(lǐng)域,模型的準(zhǔn)確性與可解釋性通常不可兼得:諸如神經(jīng)網(wǎng)絡(luò)、梯度增強(qiáng)模型等黑盒模型通常具有很高的準(zhǔn)確性。但這類模型的內(nèi)部工作機(jī)制卻難以理解,也無法估計(jì)每個(gè)特征對(duì)模型預(yù)測結(jié)果的重要性,更不能理解不同特征之間的相互作用關(guān)系。而線性回歸和決策樹之類的白盒模型的預(yù)測能力通常是有限的,且無法對(duì)數(shù)據(jù)集內(nèi)在的復(fù)雜性進(jìn)行特征交互之類的建模。然而,這類簡單的模型通常有更好的可解釋性,內(nèi)部的工作原理也更容易解釋。

隱私計(jì)算如何切入大模型?

不可否認(rèn)的是,大模型是一種先進(jìn)生產(chǎn)力,是個(gè)人和企業(yè)都應(yīng)該積極擁抱的,如果因?yàn)橛须[私的顧慮而直接放棄對(duì)大模型的應(yīng)用,某種程度上無異于因噎廢食。如何正視隱私安全問題的存在,并通過相應(yīng)的手段提高隱私保護(hù)的能力、積極應(yīng)用大模型才是解決問題的正途。

通過多方安全計(jì)算、聯(lián)邦學(xué)習(xí)、可信執(zhí)行環(huán)境等技術(shù),隱私計(jì)算起著平衡數(shù)據(jù)隱私保護(hù)與數(shù)據(jù)開放共享的作用,是數(shù)據(jù)要素安全領(lǐng)域的關(guān)鍵技術(shù)之一。

大模型時(shí)代,隱私計(jì)算技術(shù)本身的研究、發(fā)展和關(guān)注的重點(diǎn)也發(fā)生著改變,為讓其更好地適應(yīng)大模型,可以重點(diǎn)關(guān)注其可用性的研究。

肖仰華認(rèn)為,隱私計(jì)算在大模型時(shí)代迎來了全新的機(jī)遇。諸如差分隱私、聯(lián)邦學(xué)習(xí)等傳統(tǒng)隱私計(jì)算都是在算法層面開展工作,但是算法層面工作的實(shí)施有其前提:例如,保護(hù)對(duì)象明確才可以實(shí)施差分隱私算法,合作協(xié)議清晰才可以施展一些聯(lián)邦學(xué)習(xí)的策略。而海量化、參數(shù)化的大模型,給傳統(tǒng)的基于可控、可解釋、清晰的技術(shù)路線的隱私計(jì)算提出了全新的挑戰(zhàn)。在不可控、不可編輯、難以解釋的大模型環(huán)境下,傳統(tǒng)方法如何進(jìn)行發(fā)展,這看似是挑戰(zhàn),更多是機(jī)遇。

此外,從算法層面上升到架構(gòu)層面,大模型的隱私保護(hù)還要從隔離機(jī)制角度分析。對(duì)于一些需要進(jìn)行分層分級(jí)保護(hù)的個(gè)人與企業(yè)私密數(shù)據(jù),可以建立起大模型自主學(xué)習(xí)能力和敏感數(shù)據(jù)相隔離的架構(gòu),大模型繼續(xù)提供其智能,而需要保護(hù)的數(shù)據(jù)和信息依然被保存在密態(tài)數(shù)據(jù)庫中,二者的相互協(xié)同也給隱私計(jì)算帶來了新機(jī)遇。

中國信通院云大所大數(shù)據(jù)與區(qū)塊鏈部門副主任閆樹表示,隱私計(jì)算的各類技術(shù)路線都有與大模型應(yīng)用場景適配的方式。比如在云端部署一些 TEE(可信執(zhí)行環(huán)境)做訓(xùn)練,或在模型推理階段用多方安全計(jì)算來提升隱私保護(hù)能力,但可能會(huì)相應(yīng)犧牲一些模型的性能。

大模型不應(yīng)成為脫韁野馬

今年 5 月,肖仰華曾發(fā)表一篇題為《不要讓大模型變成一場華麗的煙花秀》的近萬字長文,主張發(fā)展大模型的同時(shí)要形成有效監(jiān)管,對(duì)于隱私侵犯等破壞行為不能忽視,必須從產(chǎn)業(yè)的兩側(cè)加強(qiáng)安全底線、倫理標(biāo)準(zhǔn)與合規(guī)規(guī)范的建設(shè):在數(shù)據(jù)源頭端,加強(qiáng)對(duì)訓(xùn)練語料合規(guī)性的認(rèn)證;在生成結(jié)果端,對(duì)生成內(nèi)容建立起相關(guān)規(guī)范。

目前,網(wǎng)信辦正推動(dòng)《生成式人工智能服務(wù)管理辦法》的出臺(tái),對(duì)生成式 AI 技術(shù)、生成內(nèi)容、主體責(zé)任、數(shù)據(jù)源和數(shù)據(jù)處理等方面都作出了規(guī)定。

僅就隱私保護(hù)而言,我們需要建立起一個(gè)系統(tǒng)性的隱私保護(hù)防范體系:從用戶角度,要建立起對(duì)大模型隱私的安全意識(shí),要充分認(rèn)識(shí)到在使用大模型過程當(dāng)中,你的數(shù)據(jù)有可能被服務(wù)方所收集,從而導(dǎo)致隱私泄露;從提供大模型服務(wù)的廠商角度,要提升服務(wù)的規(guī)范性,給予用戶充分的知情權(quán),在用戶完全授權(quán)的情況下,合理范圍下收集用戶相關(guān)的使用的數(shù)據(jù),不應(yīng)該超出用戶授權(quán)的范圍。

技術(shù)方面,在模型與應(yīng)用之間還存在一層中間層,可以打亂、混淆用戶的數(shù)據(jù)使用與查詢記錄。此外,以大模型治大模型也是一條重要路徑,即靠大模型自身的能力來保護(hù)隱私,解決隱私問題。大模型可以識(shí)別出語料中有隱私侵犯嫌疑的內(nèi)容,我們可以利用大模型清洗隱私數(shù)據(jù)、對(duì)其生成結(jié)果進(jìn)行評(píng)估,來規(guī)避侵犯隱私問題的發(fā)生。

關(guān)鍵詞:

網(wǎng)站簡介 網(wǎng)站團(tuán)隊(duì) 本網(wǎng)動(dòng)態(tài) 友情鏈接 版權(quán)聲明 我要投稿

Copyright? 2014-2020 中原網(wǎng)視臺(tái)(www.vr-apps.cn) All rights reserved.

主站蜘蛛池模板: 狠狠干狠狠爱| 成人做爰高潮尖叫声免费观看| 日本一道本| 肉体裸交丰满丰满少妇在线观看| 色诱久久久久综合网ywww| 欧美性xxxxx极品| 国产久热精品无码激情| 娇妻玩4p被三个男人伺候| 白嫩白嫩bbbbbbbbb| 公天天吃我奶躁我的在 | 国产精品一区二区av| 国产日产欧洲无码视频| 中文字幕 欧美 亚洲| 毛片无码一区二区三区a片视频| 亚洲av白丝在线播放| 久久精品国产亚洲av九| 国产女人高潮抽搐叫床视频 | 我的乳在厨房被揉搓| 好爽轻点太大了太深了| 末发育娇小性色xxxxx| 人与禽zozo性伦| 野花高清在线观看免费全集7| 末成年╳╳0o| 亚洲精品无码永久在线观看性色| 最新亚洲av电影网站 | 丰满少妇被猛烈进入在线播放 | 韩国午夜理论在线观看| 丰满人妻熟妇乱偷人无码| 欧美成人免费全部观看| 国产在线乱码一区二区三区| 午夜精品久久久久久久爽| 亚洲日韩精品欧美一区二区| 在线视频免费观看| 亚洲精品毛片一区二区三区| 国产久热精品无码激情| √新版天堂资源在线资源| 久久午夜无码鲁丝片直播午夜精品 | 久久99精品久久久学生| 99久久久无码国产精品性| 欧美bbwxxxx| 日本黄色二区三区免费观看|