成人人人视频亚洲香蕉的|外国一级黄色中文字幕视频|av高清无码手机版线上免费播放|强奸最新av在线观看|av久久中文字幕一区|av岛国片在线观看|丁香五月激情四射综合网|国产真实偷拍黄色一级电影|日本黄色产业一区二区在线观看|午夜影院久久久草久草久久草

教育在線
教育在線
南京理工大學發(fā)布國內首個人文社會科學學術大語言模型
2026-05-09 14:11
南京理工大學
作者:

  日前,南京理工大學沈思教授團隊開源發(fā)布國內首個人文社會科學領域學術大語言模型——“蘭章”,標志著該校在“AI+人文社會科學”知識體系構建方面邁出重要一步。“蘭章”憑借百億詞元的堅實數據基礎以及兩階段深度優(yōu)化訓練,較好地解決了當前通用AI工具在人文社科全文本挖掘、復雜概念和論證邏輯理解方面“盲域”和“幻覺”問題,不僅可以輔助用戶系統地獲取和梳理海量學術資源,還能夠幫助人文社會科學領域學者總體評價既有成果并敏銳發(fā)現新學術研究契機。

  “蘭章”研發(fā)團隊歷時五年,構建了總規(guī)模116億詞元的人文社會科學學術語料庫,涵蓋CSSCI、CNKI人文社科期刊、人大復印報刊資料、教育部人文社科獲獎著作全文(1992~2025年)等中文學術資源以及SSCI、A&HCI期刊摘要及Project MUSE、Project Gutenberg(1992~2025年)等學術資源,保證了學科的均衡覆蓋以及期刊與著作的深度集成?!疤m章”憑借百億級詞元的堅實數據基礎,較好解決了通用AI工具主要依靠論文標題、摘要等簡單信息挖掘語料,難以理解完整文本中復雜概念和論證邏輯的難點痛點問題。

  “蘭章”研發(fā)團隊選取人文社會科學全文本評測中表現較好的Qwen3-8B與Qwen3-32B基礎模型進行兩階段的深度優(yōu)化訓練:在第一階段,運用116億詞元的學術資料系統融入人文社科學科知識和學術表達方式,提升基礎模型的的全文本理解能力;在第二階段,團隊圍繞核心學術任務設計15697條訓練指令,在多學科專家驗證基礎上反復精細調優(yōu),形成并持續(xù)提升模型的專業(yè)推理能力。經過深度優(yōu)化訓練,“蘭章”表現顯著優(yōu)于多款通用模型,有效解決了跨語言環(huán)境下低頻專業(yè)術語的識別盲區(qū)問題和學術文本生成中的邏輯碎片問題,圖書自動分類準確率比通用模型高出30%。

  團隊負責人沈思教授介紹,“大模型不是代替學者思考,而是立足實際學術研究,把自主知識體系的構建延伸到模型化和計算化的層面,從工具層面為人文社會科學學術創(chuàng)新提供持續(xù)支持?!蹦壳?,“蘭章”已上線魔搭社區(qū)試運行,15697條訓練指令數據已全部開源共享。

  近年來,學校高度重視哲學社會科學工作,積極推進一般社會科學與學校優(yōu)勢學科群的交叉融合,以數智技術賦能哲學社會科學研究。“蘭章”的發(fā)布,是學校積極推進精品化特色化哲學社會科學研究,加快構建中國哲學社會科學自主知識體系進程中的又一最新成果。

  “蘭章”研發(fā)團隊負責人沈思現為經濟管理學院教授,博士生導師,主要研究方向為信息檢索、大語言模型,近五年主持國家社科基金重點項目、國家社科基金后期資助項目、國家自然科學基金面上項目、江蘇省哲學社會科學基金、江蘇省自然科學基金等項目7項,2025年獲江蘇省第十八屆哲學社會科學成果獎二等獎。

  附:“蘭章”大語言模型開源地址

  https://modelscope.cn/models/njauzwh/HssaLLM-8B

  https://modelscope.cn/models/njauzwh/HssaLLM-32B

  https://modelscope.cn/datasets/njauzwh/HssaLLM-SFT-data

免責聲明:

① 凡本站注明“稿件來源:教育在線”的所有文字、圖片和音視頻稿件,版權均屬本網所有,任何媒體、網站或個人未經本網協議授權不得轉載、鏈接、轉貼或以其他方式復制發(fā)表。已經本站協議授權的媒體、網站,在下載使用時必須注明“稿件來源:教育在線”,違者本站將依法追究責任。

② 本站注明稿件來源為其他媒體的文/圖等稿件均為轉載稿,本站轉載出于非商業(yè)性的教育和科研之目的,并不意味著贊同其觀點或證實其內容的真實性。如轉載稿涉及版權等問題,請作者在兩周內速來電或來函聯系。

相關新聞