日前,陜西省西安市煙草專賣局(公司)在行業內率先建成人工智能320G高性能算力中心,并在模數雙驅動的人工智能中臺及行業特征語言大模型研究與應用工作中取得了階段性成果。
在陜西省煙草專賣局(公司)的指導下,西安市煙草專賣局(公司)依托人工智能320G高性能算力中心,構建了一套“統一人工智能模型編碼、統一行業特征數據訓練、統一人工智能算力輸出、統一研發管控對接標準”的模數雙驅動人工智能中臺,建立了具有行業特征屬性的語音語義識別、圖像識別、認知情感分析、文本差異提取等AI能力模型,實現了各業務智能化場景的集中AI能力輸出、調用、訓練和管控,從而促進各業務系統智能交互,實現人工智能與新型基礎設施的融合。
在此基礎上,西安市煙草專賣局(公司)自主研發基于人工智能語言大模型的“智能客服”軟件。以煙草行業特征預訓練語言大模型為技術基座,在微信公眾號上分別研發部署了兩個自然語言交互智能機器人軟件,實現了面向零售客戶的24小時在線智能交互服務。該軟件能夠自我管理、自我調節,精準適應客戶習慣,深入理解用戶意圖、情感和語氣,生成自然、流暢的語言回應和智能化的回答建議。該軟件的廣泛應用,可以及時獲取零售客戶和消費者情緒變化,從而靶向施策,有針對性地開展客戶服務,提升客戶滿意度。同時,他們著手試點人工智能中臺與一體化平臺專賣子系統對接,完成一體化平臺專賣子系統現場勘驗、簡易案件處理等功能與人工智能中臺的對接測試,實現了圖像識別、語音識別、語音轉文本等能力對接。
此外,依托人工智能320G算力中心,他們對Llama3、通義千問、星火等開源模型的計算速度、內存占用、識別精度等指標分別進行訓練、對比和分析,測試其在中文自然語言處理領域的應用潛力,選擇模型體量最為合適且效果最好的模型作為基礎模型。隨后,按照數據采集、數據清洗和預處理、特征工程、模型訓練和微調、模型評估和應用等步驟,對基礎模型進行行業數據語料訓練,研究形成了具有行業特征的預訓練語言大模型。該成果將融入行業現有各平臺建設中,有效提升行業新質生產力的應用能力和業務處理的智能化水平。
篤行致遠 2024中國煙草行業發展觀察