生成式AI的隱私與機密資訊外洩隱憂
2023.04.17
瀏覽數
2105
壹、新聞重點
美國非營利組織OpenAI於2022年11月推出自動生成文本的聊天機器人(chatbot)ChatGPT後,成為以創造內容為目的、而非單純預測的生成式人工智慧(generative AI,以下簡稱生成式AI)應用代表。ChatGPT透過使用者提問以文字對談方式互動,由網路上既有之巨量訓練數據中學習、再生成原創文本內容,並由使用者回應不斷改進結果,其強大功能不僅獲得廣大迴響,其應用潛力也引起商業界重視,認為整合生成式AI將大幅提高工作效率並徹底改變工作型態,使各大科技巨頭競相投入生成式AI研究開發並推出新服務,以期能搶佔市場先機。
然而,在各式應用逐漸普及的同時,ChatGPT傳出因程式漏洞而洩漏其他使用者對談紀錄,以及三星電子因員工在ChatGPT提問工作相關問題,使相關營業秘密資訊成為學習資料,已造成相關資訊外洩等具體事例。[1] 未來類似ChatGPT此種生成式AI服務的隱私與機密外洩隱憂,將是AI風險管理與政策重點,並影響後續生成式AI應用與服務導入的發展方向,以下就此進行分析。
貳、安全意涵
一、生成式AI普及凸顯破壞式創新潛力
生成式AI的突破,奠基於自然語言處理領域的大型語言模型(large language model, LLM)快速發展。以美國OpenAI組織的生成式預訓練模型為例(Generative Pre-trained Transformer, GPT),GPT模型具有龐大的參數,而為了解輸入語言的涵義,其訓練必須仰賴龐大的語料庫以及計算資源。先以語料庫進行預訓練(pre-training),了解字詞及語意的連結,再進行微調。此類大型語言模型,不僅套用在以文字與使用者互動的ChatGPT,也能用於從文字生成圖像、甚至是影像,提供更多樣的內容生成服務。[2]
此類大型語言模型的發展,使AI 不再僅限於單純將辨識大量資訊並分類,還能理解使用者需求並進一步生成新的內容,由此降低內容產製的門檻,進而有更多應用潛力甚至改變既有工作與產業型態,美創投公司紅杉資本(Sequoia)評估生成式AI具有數兆美元的潛在應用商機,可視為破壞式創新(disruptive innovation)的典型案例。[3]
二、生成式AI應用風險仍缺乏有效架構評估
不過,三星電子內部員工在工作時使用ChatGPT造成機密資料外洩,凸顯生成式AI運用與風險目前仍缺乏有效架構評估並因應。以台積電為例,也傳出以基於公司資安管理的機密資訊保護政策(Proprietary Information Protection, PIP),禁止員工使用ChatGPT詢問與公司營業秘密相關事項。台積電接受採訪時的說明,即顯示其擔憂其來有自。若競爭對手向ChatGPT提問台積電員工詢問的問題,由ChatGPT整理近日詢問事項,競爭對手即可能從此觸及台積電內部事務,如研發過程瓶頸,窺探台積電先進製程開發進度,甚至可能解法。[4] 除營業祕密外,若員工與生成式AI對談內容涉及公司所持有的客戶個人資料,也可能產生客戶隱私外洩疑慮,如電子商務、投資銀行等業者,已陸續傳出禁止員工使用ChatGPT詢問具個資及營業秘密資料問題的事例,但ChatGPT用戶數依舊以超越過往各項網路服務的速度快速成長。因此,禁用生成式AI雖然暫時管控可能的資料外洩風險,長期來看恐並非有效的因應作為。[5]
參、趨勢研判
一、生成式AI將以人工智慧即服務方式擴大應用
基於企業或組織對於ChatGPT可能造成的隱私與機密資料外洩疑慮,未來生成式AI的商業模式,將朝向整合雲端系統的「人工智慧即服務」(AI as a Service, AIaaS)方向發展,以提供企業可彈性化佈署的雲端運算資源、整合既有雲端服務平台中,並提供客製化AI模型訓練服務與支援,降低生成式AI導入門檻。[6] 由於企業或組織內部資料上雲已行之有年,在「共同責任模型」下(shared responsibility model),雲端服務供應商以及用戶共同承擔雲端安全的責任,並依據服務型態劃分責任範圍。[7] 如以內部資料進行訓練,仍屬現有雲端資料保護架構範圍,以此模式為基礎,較能兼具應用彈性以及資料保護需求。
二、歐盟將持續推進AI治理框架與管制措施
歐盟在2018年《一般資料保護規範》(General Data Protection Regulation, GDPR)正式實施後,對於組織蒐集、儲存以及運用個人資料已建立基本規範,因此即使生成式AI使用的語料庫來自公開的網路資料,若對象涉及歐洲公民,仍屬於GDPR管轄的範疇。義大利個資保護機關基於GDPR的規範,針對ChatGPT無法限制13歲以下用戶使用該系統、無法核實個人資料是否正確、個人亦無法被告知其資料是否已由系統收集,以及大規模收集個人資料缺乏法規基礎四項疑慮,於3月31日宣布義大利國內暫時禁用ChatGPT,亦促使OpenAI與義大利個資機關商討可能解決方案。[8]
而在歐盟其他國家中,西班牙已提請歐盟個人資料保護委員會(European Data Protection Board)就ChatGPT隱私疑慮進行評估;法國個資保護機關亦已收到相關訴願,但對禁用ChatGPT傾向不跟進。[9] 可預期歐盟未來將會在既有資料治理框架GDPR以及發展中的《人工智慧法》(Artificial Intelligence Act)草案下,將AI視為商品,並以商品安全的架構針對AI之現象與風險進行分級管控,持續在AI治理框架與管制措施方面推進,進而影響生成式AI以及其應用發展。[10]
[1]蔡芸瑄,〈三星引入ChatGPT不到20天 爆3件半導體機密資料外洩事故〉,《DIGITIMES科技網》,2023年3月31日,https://www.digitimes.com.tw/tech/dt/n/shwnws.asp?id=0000660911_GV3LF27M0DYJ0I2ZJ5Y85; Mariella Moon, “ChatGPT Briefly Went Offline after A Bug Revealed User Chat Histories,” Engadget, March 21, 2021 https://www.engadget.com/chatgpt-briefly-went-offline-after-a-bug-revealed-user-chat-histories-115632504.html。
[2]Benjamin Larsen and Jayant Narayan, “Generative AI: A Game-changer that Society and Industry Need to be Ready for,” World Economic Forum, January 9, 2023, https://www.weforum.org/agenda/2023/01/davos23-generative-ai-a-game-changer-industries-and-society-code-developers/.
[3]Sonya Huang, Pat Grady and GPT-3, “Generative AI: A Creative New World,” Sequoia, September 19, 2022, https://www.sequoiacap.com/article/generative-ai-a-creative-new-world/; Atin Gupta and Geoffrey G. Parker, “How Will Generative AI Disrupt Video Platforms?” Harvard Business Review, March 13, 2023, https://hbr.org/2023/03/how-will-generative-ai-disrupt-video-platforms.
[4]簡永祥,〈台積電憂洩密 管制使用ChatGPT 提前架設資安防護網〉,《聯合報VIP》,2023年3月28日,https://vip.udn.com/vip/story/121938/7057559。
[5] Sam Sabin, “Companies Are Struggling to Keep Corporate Secrets Out of ChatGPT,” Axios, March 11, 2023, https://www.axios.com/2023/03/10/chatgpt-ai-cybersecurity-secrets; David F. Carr, “ChatGPT Tops 25 Million Daily Visit,” similarweb Blog, March 21, 2023, https://www.similarweb.com/blog/insights/ai-news/chatgpt-25-million/.
[6]Dylan Martin, “Nvidia Teases DGX Cloud AI-As-A-Service As Earnings Wow Wall Street,” CRN, February 22, 2023, https://www.crn.com/news/components-peripherals/nvidia-teases-dgx-cloud-ai-as-a-service-as-earnings-wow-wall-street;
[7]“Shared Responsibility Model,” 2023, AWS, https://aws.amazon.com/compliance/shared-responsibility-model/; “Shared Responsibilities and Shared Fate on Google Cloud,” Google Cloud, July 7, 2023, https://cloud.google.com/architecture/framework/security/shared-responsibility-shared-fate; “Shared Responsibility in the Cloud,” Microsoft, December 6, 2022, https://learn.microsoft.com/en-us/azure/security/fundamentals/shared-responsibility.
[8]Matt Burgess, “ChatGPT Has a Big Privacy Problem,” Wired, April 4, 2023, https://www.wired.co.uk/article/italy-ban-chatgpt-privacy-gdpr; Kelvin Chan, “OpenAI to offer remedies to resolve Italy’s ChatGPT ban,” AP News, April 6, 2023, https://apnews.com/article/chatgpt-openai-data-privacy-italy-1e3f070ca86ec234cae4d08ac8443879.
[9]Laura Kayali, “French Digital Minister: ChatGPT Doesn’t Respect Privacy Laws,” Politico, April 7, 2023, https://www.politico.eu/article/french-digital-minister-chatgpt-doesnt-respect-privacy-laws/.
[10]Brian McElligott, “ChatGPT and the EU AI Act,” Lexology, March 29, 2023, https://www.lexology.com/library/detail.aspx?g=699e8936-6997-4248-a289-4c1f903d4ef3.