什麼是生成式AI?企業如何應用生成式AI提高效率?

瀏覽數:1063


  2022 年底推出的生成式AI 應用 ChatGPT,在短短五天內就有超過一百萬人註冊使用,瞬間席捲全球。事實上ChatGPT—GPT 代表生成式預訓練轉換器(Generative Pre-trained Transformer) —是一種免費的聊天機器人,它幾乎可以回答任何提問。它由 OpenAI 開發,並於 2022 年 11 月向公眾發布測試,已被認為是有史以來最好的 AI 聊天機器人。

  根據一項2022年所做的調查顯示:在過去五年中,企業對人工智慧的採用率成長了一倍以上,而對人工智慧的投資也正在迅速增加。很明顯地,像 ChatGPT 和 DALL-E(AI 生成藝術的工具)這樣的生成式 AI 工具有可能改變許多工作的執行方式。那麼,什麼是生成式 AI 呢?它們可以解決哪些類型的問題?在企業內又有哪些明顯的用途呢?

  本文將探討什麼是「生成式 AI」?它們有什麼特性?生成式 AI模型如何運作?他們是如何訓練的?生成式 AI 模型可以解決哪些類型的問題?企業應該如何善用這些用處?這些都跟企業未來的營運方式和績效表現息息相關。

什麼是「生成式 AI」?

  生成式人工智慧(AI) 是一種機器學習模型(例如ChatGPT、Bing AI、DALL-E 和 Midjourney),內含可用於內容創新的演算法,它們在龐大的資料庫上進行訓練,以生成新的內容以針對提示做出回應,這些內容包括:音訊、程式、圖像、文本、模擬和影片。

  以前的AI大多只是分析工具,它會幫我們蒐集並分析大量資料,可用於觀察資料中的模式並加以分類,最後對新的資料做出預測。例如:人工智慧的經典案例是從數張可愛的貓或狗的圖像開始,經過訓練的模型可以識別圖像中的模式,然後仔細檢查隨機的圖像並辨識出符合貓咪或小狗特徵的圖像。生成式人工智慧則是一種突破,它並不只是簡單地感知貓或狗的照片並加以分類,現在的AI能夠依照要求生成貓或狗的圖像或以文字描述它們的特徵。

生成式 AI有什麼特性?

  一般而言,生成式 AI有預訓練、自然語言處理和生成式等三種特性。

  1. 預訓練(Pre-trained )

由於訓練人工智慧模型需要大量的資料,並非任何特定任務都有足夠的資料量可以進行訓練,因此有分階段訓練的方式。先針對一般性需求訓練一個通用性的基礎模型(foundation model),然後在基礎模型上再針對某項特定領域的需求,以少量資料進行微調(fine-tuning),使模型能夠更精確地完成該項任務。而前述滿足通用性需求的大型模型,就稱為預訓練模型,更清楚來說應該是預先訓練好的通用模型。

  1. 自然語言處理(Natural Language Processing, NLP)

自然語言(Natural Language)是人類為了溝通而使用的語言,如英文、中文、日文等。而自然語言處理(Natural Language Processing, NLP)是一種機器學習技術,讓電腦能夠理解並使用人類語言。具體而言,包括對語音、文本、語言等進行交互分析和處理,目的在實現人機互動、機器翻譯、語音辨識、情感分析等應用。

  1. 生成式(Generative )

生成式指的是機器學習模型的輸出是生成文字,模型訓練的目標要從龐大的資料中,嘗試找出自然語言詞彙在使用上的潛在規律,當輸入端給予一個句子或一段話,模型要能輸出接續在後面最適當的文字內容。若將模型的生成內容再重新輸入並加入新的句子,會繼續輸出相關的內容,不斷來回就形成人機互動的對話應用。除了生成文字之外,目前A I也可以生成其他各種形式的資料,包括圖像、音樂、程式、影片、3D模型等,統稱為生成式人工智慧(Generative AI, GenAI)。

生成式 AI模型如何運作?他們是如何訓練的?

  早期處理大量文字資料(術語稱之為文本)的機器學習模型是主要由人類訓練的,可以根據研究人員的標示對各種輸入的內容進行分類。其中一個著名的例子是訓練模型將社群媒體貼文標記為正評或負評。這種類型的訓練稱為監督式學習,因為是人類負責“教”模型做什麼。由於人工整理需要花費很多時間,可以使用的語料庫有所局限,訓練出來的對話自然也比較生硬。

  GPT模型則採用非監督式的學習先進行訓練。這種類型的訓練除了整理好的語料庫之外,也可使用未整理妥當的文本資料,大幅增加訓練資料的多元性,加上採用了很多有效率的處理架構,因此在各種自然語言處理(NLP)基準測試中都取得的飛躍性的突出成果。

  生成式AI的訓練主要依賴深度學習技術,其中最常見的有:生成對抗網絡、長短期記憶網絡和轉換器模型。

  1. 生成對抗網絡 (Generative Adversarial Networks, GAN)

生成對抗網絡是由兩個功能組成的系統:生成器(Generator),用於生成假的資料,以及鑑別器(Discriminator),用於區分真假資料。

運作方式是由生成器透過反覆生成假資料並且調整參數,嘗試讓其生成的假資料越來越接近真實資料。而鑑別器則不斷辨別真假資料,並調整參數以提高辨識能力。這種反覆訓練的過程,可以讓生成器學習到如何生成更加真實的資料,而鑑別器則可以不斷提高辨識真假資料的能力,從而形成一個不斷進化的系統。

  1. 長短期記憶網絡(Long Short-Term Memory, LSTM)

長短期記憶網絡是一種 RNN(循環神經網路),跟一般深度神經網路不同,多了資料的方向性(時序關聯),RNN 會將每一個隱藏層的結果儲存在記憶單元,而且當新的資料進來的時候,會考慮記憶單元的值去計算。長短期記憶網絡的特色是能夠學習長距離的依賴關係(Long-Term Dependencies),主要用於文本生成方面。它可以通過學習一個大量的文本資料集,記住前面的單詞,並且預測下一個單詞。

舉例來說,假設我們有一個簡單的文本資料集:「貓坐在墊子上」,當LSTM網絡訓練完成後,我們可以輸入「貓」作為起始點,然後LSTM網絡可以預測下一個詞為「坐在」,接著我們可以將「坐在」作為新的起始點,再次輸入LSTM網絡中,繼續生成下一個詞,如此反覆,直到生成一個完整的句子。

  1. 轉換器(Transformer)模型

轉換器是一種非常強大的神經網絡模型,它可以用於自然語言處理、圖像處理、音訊處理等序列資料類型(資料的前後順序有所關聯)的各種生成式任務。最主要的特點就是它使用了一種稱為自注意機制(self-attention mechanism)的技術,這種技術可以讓每個詞彙可各自套用其機制,而產生跟其他詞彙不同的關聯性,並從不同的關聯性比對找出最適當的詞彙進行輸出。當字詞的上下文不同時,詞彙的關聯性會隨之調整,輸出內容也會反覆根據前文來產生文字,等於在原文和輸出之間來回檢視(因為上下文不斷變化)。

因為自注意力機制可以分開運算,也有助於加速訓練模型所花費的時間。這些特色讓轉換器成為自然語言處理等序列資料領域的主流架構,而ChatGPT就是用轉換器模型進行訓練的。

企業應該如何善用這些用處?

  最近在美國的一份研究報告發現:資訊技術、行銷和業務、客戶服務以及產品開發對於企業的第一波應用來說最為成熟。

  • 資訊技術

生成式 AI 可以幫助團隊編寫程式碼和文件。它可依據使用者寫的程式,自動補全程式碼上下文、給予建議、自動完成註釋,甚至能提供樣板程式碼(Boilerplate code)當作參考。市面上的自動編碼器已經將開發人員的工作效率提高了 50% 以上,有助於加速軟體開發。

  • 行銷和業務

銷售團隊可以使用生成式 AI 應用程式來創建用於拓展客戶的內容。生成式AI模型的能力非常適合銷售部門。銷售需要密集的互動和交易,會產生大量資料,包括來自電子郵件串的文本、電話交談的音訊和個人互動的影片。而生成式AI正是用來處理非結構化資料的模型。銷售的創意和靈活變化性質,為生成式AI創造了解釋、學習、連結和客製化的龐大商機。兩年內,預計有30% 的對外行銷資訊將在生成式AI系統的幫助下開發。

  • 客戶服務

生成式AI可以做到自動生成回覆、處理客戶查詢、推薦快速解決方案並引導客戶獲取所需資訊;並且可以提供客服人員改寫建議,還能針對不同情境或服務場景調整語句長短、修飾語氣(如輕鬆、專業、嚴謹、開玩笑等等),以更加自然、個性化的回覆提升對話式商務的轉換率和顧客滿意度。

  • 產品開發

公司可以使用生成式 AI 快速設計原型產品。例如,生物科技公司已經開始探索使用生成式人工智慧來幫助生成胺基酸和 DNA 核苷酸序列,從而將藥物設計階段從數月縮短至數週。另一個例子是:科學家可以向AI下令,製作出一款能阻擋流感病毒株的蛋白質,AI製作的成品會先被放到合成式DNA,接著再植入細菌中,等到細菌複製到一定的量,就能製作成藥品,實測成效。

  儘管許多人對生成式 AI感到恐懼,但人工智慧顯然具有其正面的意義。在未來幾個月到幾年內,風險和機會的面貌可能會迅速轉變。企業在未來幾年可能會不斷地開發新模型,而且每個月都會測試新案例。隨著生成式人工智慧越來越多且融入企業、社會和我們的生活,我們也期待它可以為我們開創新的價值。

 

【參考資源來源】

  • “What is Generative AI”, McKinsey Explainers, January 2023
  • “Exploring opportunities in the generative AI value chain”, McKinsey Digital, April 2023
  • 「深度學習的16堂課」,旗標科技股份有限公司,2021年8月
  • “How Generative AI Will Change Sales”, Prabhakant Sinha, Arun Shastri, Sally E. Lorimer, Harvard Business Review, June 2023
  • 「不只能創作藝術! 「生成式AI」可開發新藥、疫苗」,鏡新聞,2023年2月17日
更多資訊請參考...
{{item.title}}
生產力中心提供的活動資訊
{{item.title}}
相關出版品...