在自己的电脑运行清华开源语言模型 ChatGLM-6B

有人说 AIGC 用 2 年时间走完了互联网 10 年的路,因为大家看到的是围绕 AI 的产品在最近如雨后春笋般涌现,看不到的事各领域大佬早在几年前已经开始了相关布局

过去这段时间 AIGC 市场竞争异常激烈,各大厂纷纷祭出自家的大预言模型,在这场国产 AI 大乱斗中,清华大学于 2023 年 3 月 28 日发布的开源通用语言模型 —— ChatGLM-6B 显得格外不同,因为这是一款开源的语言模型。

ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。

每个人都可以将源代码和模型下载到自己的电脑上运行。这也许才是未来 AI 正确的打开方式,避免一家独大造成垄断格局。

我尝试在自己的 MacBook Air M1 和一台 Linux 虚拟机平台运行了该模型,并记录了运行过程和最终效果。

详细请看:https://skybyte.me/74.html


在自己的电脑运行清华开源语言模型 ChatGLM-6B
https://www.frytea.com/post/20230416021400.html
作者
Tianlun Song
发布于
2023年4月16日
更新于
2024年6月10日
许可协议