9月20日,由農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)大數(shù)據(jù)重點(diǎn)實(shí)驗(yàn)室、中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所聯(lián)合湖北省圖書館、華中農(nóng)業(yè)大學(xué)圖書館、鄭州師范學(xué)院傳播學(xué)院、中華書局古聯(lián)(北京)數(shù)字傳媒科技有限公司等單位開發(fā)的古農(nóng)文垂直領(lǐng)域大語言模型“齊民”在北京正式發(fā)布。
中華文明源遠(yuǎn)流長,農(nóng)業(yè)文明是其重要組成部分。五千年的農(nóng)耕歷史孕育了燦爛的華夏文明,也留下了浩如煙海的古農(nóng)書文獻(xiàn)。這些古農(nóng)書是中華民族智慧的結(jié)晶,蘊(yùn)藏著豐富的農(nóng)業(yè)知識和寶貴的實(shí)踐經(jīng)驗(yàn),是傳承和弘揚(yáng)中華優(yōu)秀傳統(tǒng)文化的重要載體,也是指導(dǎo)發(fā)展現(xiàn)代農(nóng)業(yè)的重要資源寶庫。
然而,由于古農(nóng)書年代久遠(yuǎn),文字艱澀,內(nèi)容龐雜,加之現(xiàn)代科技發(fā)展迅速,信息獲取途徑多元化,使得這些珍貴的農(nóng)業(yè)遺產(chǎn)面臨著傳承斷裂、利用不足的困境。如何有效挖掘、整理、利用這些古農(nóng)書,使其煥發(fā)出新的生命力,服務(wù)于現(xiàn)代農(nóng)業(yè)發(fā)展,成為一項(xiàng)重要課題。
近年來,隨著人工智能技術(shù)的飛速發(fā)展,特別是自然語言處理技術(shù)的突破,為破解這一難題帶來了新的機(jī)遇。中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所農(nóng)業(yè)大數(shù)據(jù)挖掘團(tuán)隊(duì),敏銳地捕捉到這一發(fā)展趨勢,在國家社會(huì)科學(xué)基金重大項(xiàng)目“中國古農(nóng)書的搜集、整理與研究”的支持下,歷經(jīng)數(shù)年潛心研發(fā),研發(fā)出我國首個(gè)古農(nóng)文垂直領(lǐng)域大語言模型——齊民古農(nóng)文大語言模型。
中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所副所長代辛介紹,該模型基于我國古代大量農(nóng)業(yè)古籍文本訓(xùn)練,從農(nóng)業(yè)古籍中汲取智慧,深入挖掘古代農(nóng)業(yè)技術(shù)、農(nóng)耕經(jīng)驗(yàn)和社會(huì)生態(tài)知識,支持農(nóng)業(yè)知識的問答、文本自動(dòng)處理、語義檢索等下游應(yīng)用。
“齊民”大語言模型具備強(qiáng)大的自然語言處理能力,可為古代農(nóng)業(yè)種植、畜禽養(yǎng)殖、農(nóng)田水利、氣象占候等農(nóng)事各方面問題提供精準(zhǔn)解答。基于該大模型的文本自動(dòng)處理、語義檢索等工具,能為農(nóng)業(yè)古籍研究學(xué)者開展古代社會(huì)和農(nóng)業(yè)研究提供高效分析支撐。
齊民古農(nóng)文大語言模型的發(fā)布,標(biāo)志著我國在古農(nóng)書數(shù)字化、智能化研究方面邁出了重要一步。齊民古農(nóng)文大語言模型不僅為古農(nóng)書研究提供強(qiáng)有力的支撐,為現(xiàn)代農(nóng)業(yè)發(fā)展提供智慧借鑒,而且將為公眾了解和學(xué)習(xí)古農(nóng)書知識提供便捷的途徑。基于該模型開發(fā)的對話應(yīng)用,將以通俗易懂的方式,向公眾普及古農(nóng)書知識,讓更多人了解和領(lǐng)略中華農(nóng)業(yè)文明的博大精深。