應用AI與RAG架構進行知識智財產製與精煉


一、 AI加上RAG的應用背景

  2025年,CPC許勝雄董事長提及「企業的產品或經營,有沒有應用AI,已經成為一個分水嶺」,當下環境中,各企業也紛紛強調經營過程中的AI應用;而企業的AI應用型態大致可分為兩大類,一種是直接將AI作為產品應用功能的一部分,例如:帶著AI的各種工具或生產機械;另一種是將AI做為協助營運之工具,用其來提升經營效率,例如:應用AI來產製新產品之設計圖、應用AI幫助程式編譯…等。

  本文所要論述的是第二種應用方式中的知識產製類別,預計探討如何將AI當作是企業內部知識智財的產製輔助工具,讓企業可以快速地從各種資料中萃取出有用的知識智財。

  過往談及企業智財議題時,最常被提及的就是「知識管理」,而過往知識管理最大的議題是「知識物件的整合」與「如何被使用」,可以想像一下一個情境,當員工遇到一個新命題,而企業也具備完善的KM系統與資料,其從系統中撈出一堆資料時,就要花很大心力來一篇一篇閱讀,並且判斷這些資料之間的相關性,這個行動模式將耗去許多時間,而AI的出現,讓這個繁瑣的人工程序有被簡化的可能,讓AI模擬人來閱讀,並對知識進行歸納與提出應用建議。

  要做到這件事情,就要讓AI懂得這個企業相關專業,但大部分的企業沒有足夠資源養出自己的AI底層模型,而一般性的AI底層模型,又有不懂企業專業領域知識的疑慮,所以「把別人已經訓練好的AI放入自身企業中,再用企業自身的資料來做回應依據,使其在有效的參考資料範圍中,作相對精準的回答」就成為了一個高性價比的解決方案,也就是今日我們要討論的「AI加RAG」應用模式。

二、AI加RAG的應用原理簡介

  RAG模式在中文可稱為「檢索增強生成」,簡單的解構其運作模式,就是當我們使用AI語言模型進行詢問時,在AI進行回答前,先進入特定的資料庫進行搜尋,讓AI在這些資料內檢索相關內容,再來回答問題,就相當於讓AI「看了指定參考資料」再回答問題,其回應的精準度自然會提升。

  關於RAG模式的詳細介紹,可參閱MKC上的另一篇文章「RAG AI 建構企業私有知識庫」。基於這樣的運作方式,企業可以引進外部訓練好的語言模型,然後套上RAG模式來訓練有效的問答方式,相比從零開始訓練的專業語言模型,這樣的AI應用模式會有效許多。

三、可應用方式與限制

  在正式開始採用這個架構前,建議企業先就未來要透過AI所生成知識的應用型態有所想像,因為這會關連到AI對資料文本內容的判讀邏輯。本文將應用類別分為以下兩類:

  1. 精準判斷型

AI所產生的回應或內容,需要完全正確,或有明確的判斷標準。例如:法規性應用,輸入對案件或是狀況的描述,請AI判斷牽涉到那些標準。

這一類的應用在企業營運中多用於處理彈性較低的事務,以生產力中心所進行的應用為例,我們將之用於同仁對採購、請假等有明確規範的回應,在這個應用中,AI會檢索同仁的提問是否具備可以回應的規範文件,同時在回應中附上文件來源,若同仁的提問不在範圍內,AI也會就語意進行「提問建議」。

這類應用未來的延伸,可以協助需要面對大量進行審核的文件,進行前期篩選與摘要資訊,例如:報價單、各式申請書、顧客訂單等。此類型的應用好處在於可以精確回答問題,而相對的,也因為比較嚴苛的回應限制,可能產生較多AI無法提供回應的狀態,故此種應用,須後端人工處理介入。

  1. 模糊應用型

AI所產生的回應或內容,做為參考型知識或是建議,可允許較大的模糊空間。例如:請AI就過去設計圖紙,生成新的創意圖像。這一類的應用,比較偏向當下熱門的「生成式應用」,和一般的生成應用的差異,在於這是「源自企業內之知識專屬生成」,在目前企業應用中,多用於內部專業知識的整合與初步企劃文件生成。

以生產力中心所進行的應用為例,我們將之用於對顧問知識的彙整,提供新人顧問一個「線上AI顧問」之服務,依據顧問過去之執業文件,協助新人了解顧問輔導手法。

此類型的應用好處在於大部分的問題,都可以找到答案,但答案的精準度與實用度,有賴於所提供資料的品質,若缺乏大量資料,與對資料品質之維護,容易產生矛盾回應,故此類型之應用,需要對RAG所檢索的資料庫進行資料品質控管。

四、企業要做的先期準備

  1. AI應用的可行分析

既然選擇了這個AI應用模式,表示企業的AI應用目的是「對自身智財進行生成或精煉」,用來加速組織內部的智財生成與應用效率,因此「擁有哪些資料」與「這些資料的當下存在態樣」決定了可以進行那些應用,也影響未來執行成本。

在起始階段,企業常有過於樂觀的期望,例如:想要讓AI對某些專案文件進行利弊分析,但這些專案資料本身僅數百筆,且這些資料沒有明確的規則來標記「利」或「弊」的影響要素,或是影響利弊判斷的要素不在資料中,還參雜了人工的隱性知識判斷,如此,便很難透過AI來達成目的。在資料型態面,如果資料多以紙本方式存在,那就要考慮執行階段,需要有將紙本轉成數位資料的額外成本。

所以在決定採用此模式之前,企業要先想清楚「要用AI來完成哪些關鍵工作流程的提升」,再檢視「當下的資料是否足以支撐AI完成這件事情」,根據資料的擁有程度,本文將AI應用於知識產製分為兩個層次,第一個層次是「單純使用企業內部資料之應用」,這個應用的前提是「所要生成的智財,無須新參考資料,就可以進行應用」,大部分是用於對大量文件進行提取與歸納,主要功能在於讓使用者,對某些議題之內涵要素可以快速確認,可以協助工作效率之提升。

例如:如果要從過去的投標計畫書中,找出特定主題的標案,可以用那些手法來完成。這一類型資料的應用,如要進行前面所提的「精準判斷型」應用時,記得要對每一份資料加註「產製時間」,因為很多內容可能隨時間而更新,但因沒標記時間,AI會以出現頻率來判斷,有加註時間標記後,就可以在判斷指令中加入「回答應以最新時間資料為準」的解讀原則,讓AI可以做出更正確之判斷。

第二個層次是「需要外部資料支撐的應用」,此類應用所要生成的內容,具備當下趨勢性,需要企業之外的資料來做補充,通常是期望生成完成度比較高的文本,而非僅是參考性資料,舉前面的例子來繼續延伸;若給特定標案主題,期望依據過去資料,生成新的標案計畫書,因為標案計畫書中,都會有當下趨勢與環境分析,這些資料,無法從過去資料中取得,就必須依賴外部資料來補充。

簡單說,在第一個層次的應用上,將結果倒入有外部資料連結的AI模型,才能完成這個目標;但採用此模式,要有機制,能確認外部生成資料的正確性。有必要時,甚至可以設計「讓AI列出參考資料出處」之功能,但這就需要再外加「即時網頁抓取」之技術,同時目標網站也需有相對應的內容呈現格式。

上述兩種模式,企業的資料取得能力,決定了可以應用的方式;舉個例子,如果想要生成一個新的董事長演講稿,這就需要第二層次的應用,因為每次演講所涉及的素材,都是當下的新資料;企業在制定AI應用前,要先檢視自身有哪些「品質可靠」的資料。

  1. 建構方式成本概算

AI發展很快,所有工具的應用成本將快速下降,如果企業僅是要用AI來幫助日常工作,例如:生成圖片、撰寫程式、影音轉檔,那無須耗費過多資源來進行本模式之採用,直接利用現在各種工具AI即可。甚至,如果資料不具備機密性,也可以考慮直接購買外部訓練好的大語言模型來進行前面所提的第一層次之應用,以2024年末的市場報價水準,一年的租用費用約在25-40萬元。

如果企業要自建內部的RAG+AI,至少要具備機械學習、AI語言模型串接、資料庫查詢等三種能力之員工,規模不大的話,1-2名人員就可以,如果企業沒相關人員,委託外部廠商是比較可行的做法,初期的建構成本,大約在150-200萬元(包含大語言模型的租用費)。

  1. 資料的清理與更新制度

RAG模式下,AI將「只從企業內部所提供之資料找答案」,所以資料內容的清理是AI回答品質的關鍵,當初次推動時,企業的做法大多是將全部相關的資料丟進RAG資料庫中,但很可能會出現對同一個詞的定義,因為時間改變而變遷,造成「過去是對的答案,當下卻不對的狀況出現」,舉例來說,假設一個公司剛換總經理,而過去資料中所提及,大多是前一任總經理的名字,那詢問AI公司總經理是誰時,將會出現過去的總經理名字。

要解決此問題,除了事前對資料內容的檢視,就只能透過持續使用來發現矛盾之處,因此,系統設計上要設計能檢索AI回應資料來源之機制,才能找出哪些資料有問題。同時,內部亦應設計資料更新制度,資料之上傳應依據專業分類,再由對應人員,定期就有疑義之資料來源進行更新,以確保內容正確性。

  1. 使用上的授權層級考量

此種模式下的資料來源,可能涉及企業的機敏資訊,而且日後還可能對外提供服務,因此,從建構之初就應對納入資料庫中的資料進行分層標記,後續才能針對不同的使用者授權層級,提供不同深入程度的AI回應。

另一種處理方式,是將不同機敏層級的資料,放入不同的索引資料庫,相當於不同層的使用者,背後是不一樣的AI,兩種各有利弊,前者效能差,需要先判讀資料標記,再進行結果萃取;後者效能較佳,但需要比較大的儲存空間,若資料增長量不大,考慮管理便利性,建議採用後者。

結論:未來AI也將走向專業分工

  在2024年起,AI大語言模型(LLM)大行其道的同時,各大企業如微軟、臉書等其實也展開了小語言模型(SLM)的訓練,而儘管相對於LLM投入較少,動輒以數百萬計的訓練成本,仍然是個體企業難以負擔的規模。

  RAG+AI的應用架構,其實就是更小領域的語言模型訓練概念,是當下中小企業可以負擔得起的應用模式。目前AI生成內容的問題,在於生成內容的可信賴度,未來企業要落實到智慧財產應用的AI型態,可能不需要一個會回答各種問題的AI,而是能針對企業專業領域進行高精確度回應的AI。

  當下發展專屬AI的成本還太高,RAG+AI的應用模式,可視為一個過渡期的應用方式,未來應有新訓練方式的出現;如DeepSeek所採行在既有成果上生成之訓練方式,會使AI底層模型的開發成本大幅降低,此時預測會有更多由專業知識文件所調教出來的SLM,屆時將RAG模式配合專業的底層語言模型,將會有更好的企業應用績效產出。

 

【參考資料】

  • 2024,黃建邦〈解鎖企業潛能助力知識管理轉型:RAG AI 建構企業私有知識庫〉。
  • 2024,黃適文〈什麼是 RAG?初學者也看得懂的檢索增強生成(RAG)基礎指南!〉
  • 2024,葉逸萱〈探索邊緣小語言模型(SLM)應用與前景〉工研院。
  • 2025,〈生成式AI與分析式AI,比一比!〉哈佛商業評論2月號。
更多資訊請參考
數位轉型卓越經營服務團

以「因應數位轉型需求與融合企業經管理論」為基礎,發揮數位盤點、系統整合、顧客體驗、商模再造、資源引導、產學鏈結及卓越營運之核心能量,協助企業規劃由諮詢診斷(改觀念)、教育訓練(育人才)、顧問輔導(伴輔導)、建置導入(導系統)、平台租賃(建平台)等五個構面展開。主要服務範疇提供包括知識數位化、經管數位化、製造效能優化、服務體驗優化、商業模式轉型、產學資源介接等數位轉型服務。

教育訓練網

CPC整合內外部顧問、講師、學者及專家,透過公開班及廠訓,為企業界培育無數傑出人才。培訓內容包含:經營領導、策略規劃、ESG永續發展、智慧製造與數位應用、生產/品質管理、行銷管理、人力資源管理、研發管理、設計創新、財會與內控管理、專案管理、勞工與消防安全、公共工程品質管理、語言進修等。

猜你喜歡
*
知識管理的轉型之路

為協助企業提升未來智慧製造升級之技術能量,近年來為配合政府發展智慧機械政策,知識管理已從傳統基礎型結合ICT、IOT、大數據等先進技術,將內隱的關鍵知識外顯化、製程知識展開、製程知識取得、內部核心知識庫之建置與知識管理平台之建立與營運等為重點推動。

*
解鎖企業潛能助力知識管理轉型:RAG AI 建構企業私有知識庫

利用檢索增強生成(RAG)AI技術來建構企業私有知識庫,以提升知識管理的效率。介紹RAG AI的核心技術,說明了RAG AI在製造業、醫療業和金融業中的應用案例,討論企業在建置私有知識庫時的步驟和考量因素,分享了中國生產力中心的實際應用成果。

*
知識管理數位應用評量工具介紹

介紹知識管理數位應用評量工具,透過企業文化、營運流程、資訊科技及管理成效等四大面向來盤點企業現行知識管理水平,藉由盤點的過程中思考該如何運用知識管理來延續企業之核心能力及未來之價值創造,有效引領企業持續成長茁壯,並透過此評量工具協助企業強化企業關鍵價值要素,提升企業市場競爭力,有效整合傳承。

*
職場AI革命:除了ChatGPT,一定要學會的生成式AI工具!

自ChatGPT問世以來,生成式AI迅速發展,除ChatGPT、Copilot、Gemini外,許多創新AI工具應運而生。例如Perplexity強調即時搜尋與真實性,適用於學術研究;Notebook LM可整理多種格式資料並自動摘要;Felo AI能將搜尋結果轉換為心智圖;Napkin.AI有助於概念視覺化;Gamma與Decktopus則是提升簡報製作效率。透過AI工具提升工作效能,幫助職場人士提升競爭力,學會AI不是未來,是現在!

*
CEO學AI-「企業策略 AI 顧問與AI客服」建置經驗分享

作為一無程式設計經驗的退休CEO,我透過AI的協助,只用一台電競筆電,實作AI大模型的三種訓練模式並且成功建置AI客服實驗系統。希望我的分享能為企業開啟幾乎零成本且省時的AI學習之路。

您可能會有興趣的出版品
您可能會有興趣的課程
{{c.area}}
{{c.title}}

上課時間 {{c.startDate}} ~ {{c.endDate}}