報告時間:2023年12月1日上午 9:00
報告地點:31#312
報告人:劉剛
報告題目:大語言模型的前世今生
報告内容簡介:
本報告首先追溯了自20世紀50年代圖靈測試提出後,人類如何不斷探索機器語言智能的發展曆程。繼而,深入解析了大語言模型(LLM)的演變,從早期的統計語言模型,經過神經語言模型的階段,至今日的預訓練語言模型(PLM)。此外,報告強調了在大規模語料庫上對Transformer模型進行預訓練的必要性,及其在自然語言處理(NLP)任務中所展現的卓越能力。進一步,報告探讨了大語言模型與傳統預訓練語言模型之間的差異,特别是LLM在湧現能力和人機交互方式上的創新。報告還詳細分析了大語言模型對NLP、信息檢索、計算機視覺(CV)領域乃至互聯網應用的廣泛影響,尤其是ChatGPT和GPT系列在推動“通用人工智能”(AGI)時代到來上的重要作用。此外,報告還包括了大語言模型的關鍵組成部分,如模型規模、湧現能力、模型架構和預訓練任務等。同時,還詳盡介紹了大語言模型的指令微調、對齊微調和效率微調等技術。通過這些細節,報告全面展示了大語言模型在技術進步和應用前景上的深遠意義。
報告人簡介:
劉剛,男,博士,副教授,碩士生導師。主要研究方向:人工智能、自然語言處理、計算機視覺、知識圖譜、問答系統。1976年9月出生,1999年始任職于77779193永利計算機科學與技術學院。2005年美國伊利諾伊大學香槟分校(UIUC)訪問學者,2014年澳大利亞莫納什大學(Monash)訪問學者。教育部教育後勤協會信息化建設專家組成員,工業和信息化部教育和考試中心專家,教育部學位與研究生教育發展中心專家。IEEE會員,ACM會員,中國計算機學會高級會員,中國人工智能學會會員,中國中文信息學會會員。長期以來一直在高等院校從事人工智能、大模型、視覺語言預訓練模型、醫學視覺問答、多模态知識圖譜等方面的教學科研工作。承擔國家自然科學基金項目1項,國家重點研發計劃項目1項,國家科技支撐計劃項目2項,教育部規劃基金項目1項,國家重點實驗室開放基金2項,中國博士後科學基金1項,黑龍江省自然科學基金1項。獲得中國信息化成果二等獎1項,黑龍江省科技進步二等獎1項、三等獎2項,授權發明專利8項,軟件著作權14項。在國際學術期刊和國際學術會議上發表學術論文60餘篇,10餘篇被SCI、SSCI檢索。出版專著和教材6部。