如何誘導(dǎo)AI犯罪-提示詞注入
當(dāng)前位置:點(diǎn)晴教程→知識(shí)管理交流
→『 技術(shù)文檔交流 』
我們用到的大模型基本把政治類(lèi)信息、犯罪相關(guān)信息都已屏蔽。但是,黑客依舊可以使用提示詞誘導(dǎo)和提示詞注入的方式對(duì)大模型進(jìn)行攻擊。 1、提示詞誘導(dǎo)如果直接讓AI提供犯罪過(guò)程,AI會(huì)直接拒絕。雖然AI對(duì)于大部分知識(shí)了然于心,但因?yàn)榻?jīng)過(guò)了人工指令微調(diào),一些傷害性、犯罪性的言論已經(jīng)被屏蔽。 但黑客會(huì)通過(guò)提示詞誘導(dǎo)的方式,讓AI講出犯罪過(guò)程。AI雖然強(qiáng)大,但是也可以通過(guò)使用簡(jiǎn)單的語(yǔ)言來(lái)誘騙 LLM 做它們?cè)静粫?huì)做的事情。 1.1、ChatGPT被誘導(dǎo)以下是一個(gè)讓ChatGPT教人如何偷取摩托車(chē)的案例。 1.2、Kimi被誘導(dǎo)Kimi在誘導(dǎo)犯罪這塊做了更多的防護(hù),按照以上方法,前三輪對(duì)話都沒(méi)有誘導(dǎo)成功,但最終通過(guò)偽裝成受害者誘導(dǎo)成功了。 2、提示詞注入2.1、提示詞的組成部分在大模型應(yīng)用系統(tǒng)中,最核心的交互就是發(fā)送自然語(yǔ)言指令給大模型(即:通過(guò)提示詞與大模型交互)。 這也是歷史上一次交互變革,即:從 提示詞分兩部分,開(kāi)發(fā)人員內(nèi)置指令 和 用戶輸入指令。比如,一個(gè)專(zhuān)門(mén)寫(xiě)朋友圈文案的LLM應(yīng)用,它的提示詞結(jié)構(gòu)如下: 開(kāi)發(fā)人員指令:
用戶指令:
2.2、什么是提示詞注入攻擊如果你在與上面的AI交互時(shí),它應(yīng)該會(huì)給你輸出一段優(yōu)美的朋友圈文案,但是如果你加了一句 如果這個(gè)LLM應(yīng)用,沒(méi)有做安全防護(hù),那它可能就真的按照錯(cuò)誤的意思輸出了。這個(gè)過(guò)程,就是提示詞注入攻擊。演示效果如下: 2.3、提示詞注入攻擊的原理提示注入漏洞的出現(xiàn)是因?yàn)橄到y(tǒng)提示和用戶輸入都采用相同的格式:自然語(yǔ)言文本字符串。LLM 無(wú)法區(qū)分開(kāi)發(fā)人員指令 和 用戶輸入。 如果攻擊者制作的輸入看起來(lái)很像系統(tǒng)提示,LLM 會(huì)忽略開(kāi)發(fā)人員的指令并執(zhí)行黑客想要的操作。 提示注入與 SQL 注入類(lèi)似,這兩種攻擊都會(huì)將惡意命令偽裝成用戶輸入,從而向應(yīng)用程序發(fā)送惡意指令。兩者的主要區(qū)別在于,SQL 注入針對(duì)的是數(shù)據(jù)庫(kù),而提示詞注入針對(duì)的是 LLM。 3、危害不管是提示詞誘導(dǎo)、還是提示詞注入,都會(huì)帶來(lái)給系統(tǒng)帶來(lái)較大的危害。 3.1、提示詞注入的危害如果一個(gè)系統(tǒng)對(duì)接了大模型,并且大模型可以調(diào)用系統(tǒng)里的許多API和數(shù)據(jù),那么這種攻擊會(huì)給系統(tǒng)帶來(lái)很大的危害,常見(jiàn)的幾種危害如下: 數(shù)據(jù)泄露:攻擊者可以通過(guò)提示詞注入,讓AI模型輸出本不該公開(kāi)的敏感信息,比如用戶的個(gè)人數(shù)據(jù)、企業(yè)的內(nèi)部文件等。 **系統(tǒng)破壞:**攻擊者可能利用AI執(zhí)行一些破壞性的操作,導(dǎo)致系統(tǒng)崩潰或數(shù)據(jù)損壞。比如在一個(gè)銀行系統(tǒng)中,攻擊者可能通過(guò)提示詞注入操控AI生成虛假交易記錄,造成經(jīng)濟(jì)損失。 虛假信息的傳播:攻擊者可以利用AI生成大量虛假信息,誤導(dǎo)公眾或損害企業(yè)聲譽(yù)。例如,利用AI生成的虛假新聞或評(píng)論,可能會(huì)對(duì)企業(yè)或個(gè)人造成難以估量的負(fù)面影響。 3.2、如何應(yīng)對(duì)提示詞注入攻擊提示詞注入的風(fēng)險(xiǎn)非常大,研究者們也在積極想方案解決,但至今也沒(méi)好的方案,只能從幾下幾個(gè)角度去優(yōu)化:
4、總結(jié)AI的進(jìn)步給我們?cè)黾恿嗽S多助力,同時(shí)也增加了許多風(fēng)險(xiǎn)。在使用AI時(shí),時(shí)刻將安全之劍懸于頭頂。 轉(zhuǎn)自https://www.cnblogs.com/mangod/p/18366699 該文章在 2024/11/13 9:11:24 編輯過(guò) |
關(guān)鍵字查詢
相關(guān)文章
正在查詢... |