你的位置:e乐彩是正规网站吗 > 新闻动态 > 浙大这本AI狂热分子们编写的免费电子书,火了

浙大这本AI狂热分子们编写的免费电子书,火了

发布日期:2025-03-05 14:52    点击次数:96

橙柿互动讯 “正需要研究这方面的内容,真是瞌睡送枕头,爆赞!”

“老师讲得太棒了,刚看完书的第一章,马上就找到视频啦。”

“虽然近两年都在做和大模型相关的工作,但再看老师的课程,自己的知识会更全面立体,感谢老师”……

因为一本免费的电子书,浙江大学软件学院90后博导、浙江大学DAILY实验室研究员毛玉仁,以及学院里几位硕博研究生的名字,最近频繁出现在微博、小红书、知乎等各大社交平台上。

他们将大模型的基础知识,以及日常积累的、有用的最新技术,编写成《大模型基础》,发布在全球最大的代码托管平台GitHub上,供所有人免费下载学习。目前,这本书已经成为网上推荐最多的大模型学习书籍之一。

教大模型的“青椒”和学生们写了本书

这本《大模型基础》分为六大章节:语言模型基础、大语言模型架构、Prompt工程、参数高效微调、模型编辑和检索增强生成,共283页。软件学院副院长高云君教授为编撰总指导。截至目前,它在GitHub拥有7.8K Stars(星标),在这个开源社区里已是相当不错的评价。

“起初,这只是我和学生们每周一次的组内学习。”2022年,随着ChatGPT的横空出世,毛玉仁明显感受到,教材内容开始脱节。于是,他和学生们组成学习小组——他特地强调,要把参与的学生名字都写上:葛宇航、李佳晖、张超、董雪梅、宓禹、樊怡江、徐文溢、胡中豪。

这群AI狂热分子一头扎进最新的论文海洋里,试图从众多新技术、新思潮中筛选出那些有望成为经典范式的,“大概从2023年上半年开始,我们着手收集我们认为可以成为经典的技术。”

在技术快速迭代今天,这个目标并不容易。在开放的预印论文网站arXiv上,每周几乎都会更新三四百篇与大模型相关的论文,“每人每天至少要花2小时来阅读,一周一次小组讨论,选出5-7篇最有价值的。”

这个过程中,参与的同学们锻炼了筛选信息的能力和学术眼光,电子书《大模型基础》也渐渐有了雏形。

为了增加书籍的可读性,团队还想到了用动物园来举例子。比如第一章节是长颈鹿,第二和第三章节是水豚、小浣熊……

书稿完成后,有出版社找上门,毛玉仁想了想,最终选择开源。“如果想让这件事的意义最大化,让更多人了解、共同学习,开源无疑是最好的选择。”