為進一步深化人工智能等數字技術在生態環境領域的應用,江蘇省環保集團監測監控公司聯合清華大學大數據研究中心開展產學研用一體化創新攻關,研發生態環境大語言模型智能AI助手模型系統,并在省生態環境廳、南京市生態環境局開展前期試用,推進產學研用一體化創新研發。
問題導向
需求指引破解文本利用“老難題”
長期以來,生態環境領域文本大數據由于其結構多變、邏輯性強等特點導致傳統機器學習手段難以對其進行有效的數據整合及信息提取。一是分析挖掘“難”,各類分析報告、溯源報告文本數據的關鍵信息提取與結構化,往往需要投入大量的人力分析,耗時耗力;二是快速檢索“難”,實際工作中難以快速從大量的政策文件、規范制度、法律條文中查找具體條目;三是綜合利用“難”,文本材料的深度挖掘以及信息匹配往往需要耗費大量人力。
針對以上問題,監測監控公司基于新興的大語言模型技術,開展了生態環境領域智能問答助手技術研發,應用文本向量嵌入、非結構化數據存儲以及檢索增強生成等技術,將2000余份生態環境專業文本資料分類建立了9個專題知識庫,以此增強大語言模型在生態環境領域的知識儲備,使用戶可以通過直觀的對話方式對資料庫中的文本數據進行查詢、分析和再加工,完成信息檢索、報告生成、綜合分析等實際業務功能。
開放創新
校企聯動提升核心技術“硬實力”
大語言模型是近年涌現出來的人工智能領域前沿技術,監測監控公司結合行業垂直領域應用實際需求,聯合清華大學大數據研究中心開展校企合作協同創新。項目開展期間,研發團隊圍繞基礎模型選型、模型問答準確性優化以及用戶服務系統開發等方面進行技術攻關,顯著提升了項目的技術水平及產品的成熟度。通過校企聯合開放式創新,加快了核心技術研發進度。經評審,項目獲評2023年清華大學大數據能力提升項目優秀團隊。
數據安全
自主架構筑牢敏感信息“防火墻”
生態環境領域數據具有一定的敏感性和保密性要求,用戶對數據安全的要求較高。研發團隊在技術選型過程中,充分考慮系統的穩定性和安全性。采用GLM架構大語言模型作為推理基座,并結合非結構化存儲及文本向量嵌入技術進行二次開發,系統實現全部用戶數據資料的可控訪問及安全管理,可在非聯網、局域網和專網環境下運行使用,杜絕用戶信息泄露,確保用戶數據安全。
目前,生態環境大語言模型智能AI助手模型系統仍在持續優化和完善過程中,并同步在省生態環境廳、南京市生態環境局開展產品試用。后續,監測監控公司研發團隊將積極對接用戶需求,通過產品試用等方式持續收集用戶意見,改進產品性能,有效提升生態環境文本大數據分析利用能力,服務生態環境數字化和智能化治理。
版式:莊 遠
審校: 吳亞兵
原標題:產學研用融合共進丨省生態環境監測監控有限公司推動大語言模型在生態環境領域創新研發應用
版權與免責聲明:
凡本站注明“來源:環保在線”的所有作品,均為浙江興旺寶明通網絡有限公司-環保在線合法擁有版權或有權使用的作品,未經本站授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:環保在線”。違反上述聲明者,本站將追究其相關法律責任。
本站轉載并注明自其它來源(非環保在線)的作品,目的在于傳遞更多信息,并不代表本站贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。如其他媒體、平臺或個人從本站轉載時,必須保留本站注明的作品第一來源,并自負版權等法律責任。如擅自篡改為“稿件來源:環保在線”,本站將依法追究責任。
鑒于本站稿件來源廣泛、數量較多,如涉及作品內容、版權等問題,請與本站聯系并提供相關證明材料:聯系電話:0571-87759680;郵箱:hbzhan@vip.qq.com。