中國生產力中心自民國91年起開始協助經濟部產業發展署(前身為經濟部工業局)推動產業知識管理相關計畫,以提升產業界的知識管理認知與應用,進而保留企業內部專業知識、促進創新提高生產效能。
傳統知識管理(Knowledge Management, KM)主要依賴於人工收集、整理和分享知識。通常也包括文件、資料庫和內部網路等工具的應用,原來的KM在企業組織內部知識的保存和傳遞擴散上確實產生了效果,但無可厚非地也存在一些挑戰,例如資訊過載、知識更新效率、難以取得有用或有效的知識,用戶體驗感受不佳。
檢索增強生成(以下簡稱RAG,Retrieval-Augmented Generation)AI技術應用則提供了一種更先進的解決方案,為知識管理帶來新的希望。RAG AI結合了資訊檢索和語言生成的優點,能夠從企業內部大量資料中,即時且快速檢索相關資訊,並動態生成具邏輯、有意義的知識回覆,協助員工作業及企業主管決策,成為產業轉型升級的重要基礎應用。
壹、什麼是RAG AI?
RAG AI(檢索增強生成人工智慧,Retrieval-Augmented Generation AI)是一種結合檢索和生成技術的人工智慧系統。其核心概念是解析求問者的發問後,通過檢索企業提供的數據資料,作為提示語基礎,交由大型語言模型LLM來動態生成知識內容。
這不僅能快速擷取準確的資訊,還能根據具體需求生成回答,最重要的是,整體運作上,可限縮僅檢索企業所提供的知識範疇,且其機密文件無需要公開在網路上。
一、RAG AI 的核心技術
- 檢索(Retrieval)
RAG AI 系統首先會從預先建立的知識庫中檢索出與查詢相關的資訊。這些資料可以是文件電子檔、資料庫、網頁內容等。檢索技術通常使用自然語言處理(NLP)和資訊檢索(IR)技術來確保檢索結果的相關性和準確性。
- 生成(Generation)
在擷取相關資訊後,RAG AI 系統會利用語言生成模型(如 Llama、ChatGPT、Gemini或其他大型語言模型)來生成最終的知識內容。生成模型即根據檢索到的資訊和查詢內容,動態生成符合語境且有意義的語言文字。
二、RAG AI 的優勢
- 具備語言解析能力
針對求問者以自身語言的發問,RAG AI系統可透過語言模型,解析問題需求的意涵,進行更廣泛的檢索,以取得更多可能性的知識物件。
- 高效能的知識檢索
RAG AI 能夠快速從大量數據中建立關聯,檢索出相關資訊,極大地提高了知識檢索的效率。傳統的知識管理系統往往需要手動搜尋和篩選,而 RAG AI 可以自動完成這一過程,節省了大量時間和人力。
- 動態生成內容
RAG AI 不僅能夠檢索資訊,還能根據求問的需求動態產生內容。這意味著它可以提供更準確和個性化的回答,以滿足不同用戶的需求。
例如應用在客服中,RAG AI 可以針對客戶的問題生成特定的解答回應,而不只是提供預設的罐頭回答。
- 提升知識管理效率
傳統的知識管理系統往往面臨更新不及時、資訊過載等問題。RAG AI 能夠確保知識庫中的資訊始終保持最新狀態,能快速回應查詢需求,提升了知識應用整體效率
- 私有知識應用領域
企業保護自身的智慧財產不遺餘力,RAG AI 可限制僅針對內部知識文件進行擷取,管控外部存取權限使用,並可透過自建大型語言模型LLM,確保所有內部資訊不外洩,建置專屬企業的私有知識庫AI應用。
貳、企業私有知識庫應用
近年來企業界都了解知識管理的重要性,且願意投入持續精進內部的知識管理能量,以下說明各領域如何透過RAG AI技術的廣泛應用,進而提升強韌企業的競爭力。
- 製造業中的知識管理
製造企業利用 RAG AI 技術建立了私有知識庫,主要整合了來自不同部門的技術文件、操作手冊和故障排除指南。藉由建置完成的系統平台,員工可以快速檢索到所需的知識資訊,顯著提高了生產效率和問題解決的速度。
另外,系統還能動態地產出員工培訓資料,因人制宜提供所需要的知識,降低學習門檻,協助新進員工快速上手。
- 醫療業的臨床決策
醫療機構整合最新的醫學研究、臨床指南和病患資料,建立了一套臨床決策支持系統。藉由系統能夠提供醫生於診斷和治療過程中的即時建議,明顯提高診斷的準確性,降低誤判機率。
- 金融業的客戶服務
金融業銀行業務經常面對許多客戶,整合銀行業及公司的內部外金融管理知識文件、常見問題解答和客戶歷史記錄等,建立一個提供客戶服務的系統平台。系統得以能夠快速回答客戶的查詢,並提供個性化的建議,顯著提升了客戶滿意度和服務效率。
叁、RAG AI建置企業私有知識庫
企業在建立私有知識庫之前,首先應先明確企業的知識管理需求,就如同舊有的知識管理盤點程序一般,其中包括了解企業組織的業務流程、辨識出關鍵的知識領域,確定哪些資訊知識對於企業營運至關重要。
透過各部門的溝通,收集部門特殊的需求和建議,確保知識庫內提供檢索的知識文件,足以滿足企業需求。一旦需求確定後,下一步開始進入建置的作業程序。
一、選擇合適的RAG AI 平台組合
- 目前市場上有多種 RAG AI 工具可供選擇,首先需要一個支援RAG技術、提供對話介面功能的LLM大語言模型知識庫應用工具,如:基於Python 框架的 LangChain,開源且方便建構的Open WebUI、Dify、AnythingLLM 等等。
- 其次需要的就是LLM大語言模型,無論是雲端服務的OpenAI GPT、Google Gemini、Anthropic Claude 等,或是開源可下載建置於企業內部的 Meta Llama、Google Gemma、Mistral、甚至是國內本土的 TAIDE。
- 這些工具平台模型各有優勢,企業可以根據自身需求及硬體設備環境,選擇合適的模型版本運行,提供以下4個考慮因素參考:
- 性能和準確性:檢索和生成能力是否能滿足企業的需求。
- 可擴展性:是否能夠隨著企業的發展進行擴展和升級。
- 易用性:使用是否簡單直觀,操作是否順暢,員工是否容易上手。
- 營運成本:購買建置和後續維護成本是否在企業的預算範圍內。
二、知識資料收集與準備
- 收集知識數據資料
建立私有知識庫,不能靠自動文字生成或無中生有,需要以既有資料為基礎。因此企業需要收集內部的各類知識資料數據文件等,包括技術文件、操作手冊、培訓講義、客戶服務記錄等。這些來自不同的部門和系統的資料,需要進行統一的蒐集和整理。
- 資料清理與標註
蒐集到的資料可能存在錯誤、冗餘、不合時宜或不一致的問題,需要以企業知識保存傳承的角度進行清理和標註。資料清理包括去除重複、修正錯誤、統一資料格式等。資料標註則是對知識內容進行分類和標記,強化後續的資料檢索和應用。
三、著手建置私有知識庫
- 知識庫架構規劃
在資料準備完成後,需要規劃設計知識庫的架構。包括確定知識庫的層級結構、數據資料儲存方式、檢索機制等。其中重點應考慮到數據資料的類型和使用場景,確保其能夠有效率地運行。
- 導入數據與建立索引
根據設計好的架構,將清理和標註後的數據實際導入知識庫中。為了提高檢索效率,需要建立適合 RAG 的索引方式。索引內容可以根據數據的關鍵詞、類別、時間或採用問答FAQ方式進行建置,提供系統快速找到所需知識的模式。
四、系統整合與測試
- 整合現有企業內部系統
私有知識庫需要與企業現有的系統進行整合,如 ERP 系統、CRM 系統等。整合過程中需考量數據連通管道機制、建立API界面及妥善處理系統權限管理等問題。
- 系統測試與優化
在系統上線前,需要進行全面的測試。測試內容包括功能測試、性能測試、安全測試等,透過測試發現並解決問題,確保系統的穩定性和可靠性。系統上線後,還需要根據用戶意見進行持續的優化和改進。
達成最終整合企業資料文件,串聯實現知識的共享和互通,提升企業整體營運效能的目標。
肆、本中心實際應用成果
本中心作為專業顧問服務公司,在協助各行業提升知識管理能量之餘,內部亦透過RAG AI技術建構完成多個私有AI知識庫,以持續提升CPC顧問服務能量。
其中以數位轉型與資訊科技應用事業部為例,該部門取得內政部國土管理署全國人行橋梁管理系統開發維護案之委託,協助負責該系統的功能開發維護及日常系統運作服務,其中系統涵蓋作業流程包括基本設施、維護紀錄、查核記錄、管理考核等,使用者遍及全國之中央及地方等單位人員。因系統作業程序多元,各機關承辦人員分工各異且異動頻繁。
本中心負責該業務同仁,必須經常協助解答回應各單位的系統操作,及流程作業等問題,壓力重大難以負荷;且因系統內容專業,欲協助之同仁參與經驗不足,難以協助分擔;同仁應接不暇情況之下,易造成業主及使用者的怨言,影響專業形象及服務滿意度。
爰此,內部進行討論後,應用RAG AI技術進行內部知識服務能量提升。首先,初步彙整系統技術開發手冊、教育訓練文件及客服問題問答內容;同時,小規模建置於內部運行之系統技術問答知識平台;提供同仁測試並應用於回覆並解決,外部人員對於系統操作之提問。
目前應用狀況良好,未來將持續規劃推動更多的系統專案加入,檢討設備效能的提升,培養同仁建立與機器共同合作的工作模式。
伍、總結
- RAG AI 在知識管理中的重要性
RAG AI 技術在新一代的知識管理中扮演著至關重要的角色。通過結合檢索和生成技術,RAG AI 能夠快速、準確地提供所需的資訊,並根據需求生成相對應的知識內容,提升了知識管理的效率和準確性。不僅幫助企業解決了傳統知識管理系統中的諸多挑戰,如資訊孤島、數據過載和更新困難等問題,還促進了知識的共享和跨部門協作。
- 私有知識庫對企業的長遠影響
建立私有知識庫對於企業有長遠的影響。首先在於,能夠保留和傳承企業的核心知識,減少因員工流動而造成的知識流失;其次,私有知識庫能夠提高員工的工作效率和生產力,幫助企業在競爭激烈的市場中保持領先地位。最後,通過自動化的知識更新和維護,企業能夠始終保持知識庫的最新狀態,確保決策與作業的準確性和時效性。
【參考資料】
- 生產力再造卓越經營服務團, 產業知識管理加值簡介