清华系ChatGPT发布!唐杰团队打造,专对中文优化,把握新闻动态_天天通讯
丰色 发自 凹非寺
量子位 | 公众号 QbitAI
终于,清华大学 唐杰团队 也出手了。
(资料图)
就在GPT4发布的同一天,唐教授在微博宣布:
基于千亿参数大模型的 对话机器人ChatGLM ,现在开启邀请制内测。
据介绍,ChatGLM专门针对 中文 进行了优化,可以说是国人友好~
看起来,写博客提纲、创作剧本、解数学题、写代码,甚至是 扮演高冷御姐 ,它都拿捏的死死的:
△写介绍ChatGLM的博客提纲
△Cosplay聊天扮演高冷御姐
量子位有幸拿到了内测名额,将在后文进行一波实测。
与此同时,还有另一个消息宣布:
唐杰团队为了与社区一起更好地推动大模型技术的发展,同时开源了包含62亿参数的双语 ChatGLM-6B 模型。
它最大的特点是在 普通电脑 上就能进行部署,有一块2080Ti就行。
一起来看看。
能写文言文致辞,知道何恺明最新动态,但……
先看ChatGLM,它是唐杰团队大模型家族时隔半年诞生的一位新成员。
alpha内测版名称叫QAGLM (全称qa-glm-v0.7) 。
浅试一下效果。
首先,我们让它说了一下它和ChatGPT的区别。
它点出了自己的研发机构,和擅长中文的特点。
那么,就让它用文言文写个致谢词叭。
咋说,虽然多了一个“余”、出现了一个莫名其妙的繁体字,但读着还可以,用的排比句增强了气势。
接着,我们把前几日硅谷暴雷的文章开头丢给它,让它起个标题。
感觉还不错,起码抓住了几个关键信息。
不幸的是, 论文挑战没有通过 ,我们把GLM-130B的链接扔给它,让它简要概括一下主题时,它说的根本不是这篇。
跟ChatGPT胡邹参考文献的操作简直有得一拼 (手动狗头) 。
接下来,考考它的数学能力吧。
这道小学应用题没问题:
不过鸡兔同笼,就难倒它了,最后居然还算出了负数==
编程方面,也可以解决简单的算法题。
归纳信息能力呢?我们给了一段英文需求,不难:
结果正确:
需要注意的是,目前ChatGLM每轮对话最多只可以进行5个来回,每次最多输入1000字。
它对新信息的掌握度不错,知道推特现在的CEO是马斯克,也知道何恺明3月10日回归学界的事情,但还没发现GPT-4已经发布了 。
以及,目前响应速度还是非常快的,无论什么问题,回答得对不对,基本几秒内就能给出答案。
最后,量子位也让它来了个cosplay,看看哄女朋友的本事如何:
emmm,虽然有点板正,但听完这段话“我”的气确实消了。
那么,以上就是我们的测试结果,各位觉得如何?
基于1300亿参数的基座模型打造
据官方介绍,ChatGLM参考了ChatGPT的设计思路,在千亿基座模型 GLM-130B 中注入了代码预训练,通过有监督微调等技术来实现人类意图对齐 (就是让机器的回答符合人类价值观、人类期望) 。
这个GLM-130B的来头值得说道一番。
它是由清华大学知识工程实验室 (KEG) 与智谱AI共同研发的一个大规模中英文预训练语言模型,参数1300亿,去年8月正式对外发布。
不同于BERT、GPT-3以及T5的架构,GLM-130B是一个包含多目标函数的自回归预训练模型。
它的优势包括:
在Stanford报告的30个世界主流大模型评测中,GLM-130B也成为了 亚洲唯一入选 的模型。
且获得了不错的成绩:
比如在准确性和恶意性指标上与GPT-3 175B (davinci) 接近或持平,鲁棒性和校准误差在所有千亿规模的基座大模型 (作为公平对比,只对比无指令提示微调模型) 中也可圈可点。
而就在CCF最近的一场会议上,有现场观众提问:ChatGPT为什么没有诞生在中国?是我们没有关注这件事吗?
嘉宾就把GLM-130B搬了出来 (它也入选了ICLR’23) 。
现在,GLM-130B也终于被派上了“大用场”。
关于内测,唐杰团队表示,后续会逐步扩大范围,有兴趣的朋友可以再等一等。
60亿参数的缩小版同时开源
除了这个聊天机器人ChatGLM,唐杰团队这次也把GLM-130B的“缩小版” ChatGLM-6B 开源了出来。
△GitHub已经揽获近2k标星
ChatGLM-6B使用与ChatGLM相同的技术,初具中文问答和对话功能。
特点如下:
当然,缺点就是容量只有60亿,其模型记忆和语言能力较弱,不擅长逻辑类问题 (如数学、编程) ,以及多轮对话可能会出现上下文丢失和理解错误的情况。
但它主打的就是一个低门槛,在单张2080Ti上就能进行推理使用,硬件需求不高。
因此,只要有兴趣都可以下载下来试试,进行研究和 (非商用的) 应用开发都可以。
传送门: https://chatglm.cn/ https://github.com/THUDM/ChatGLM-6B
参考链接: [1]https://weibo.com/2126427211/MxlsQ6w4A#repost [2]https://chatglm.cn/blog?continueFlag=d70d7590143c950d12ac7283214d879d
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
关键词:
下一篇:最后一页
- 清华系ChatGPT发布!唐杰团队打造,专对中文优化,把握新闻动态_天天通讯
- 全球看热讯:石雪 八美人_石雪八美是什么
- 楼继伟谈硅谷银行破产事件:要完善监管制度 严守低风险底线
- 股权投资尽职调查实务(财务篇)-报资讯
- 要闻速递:3月17日基金净值:南方匠心优选股票A最新净值0.7089,跌0.31%
- 我站桩的功夫,应该是初中时被老师罚站练出来的_今日播报
- 微速讯:美国又现“弗洛伊德之死”!一黑人遭7名警察压倒后身亡
- 世界微动态丨挚文集团2022年财报:Q4营收下滑12.6%,净利润大增,股价重挫超8%
-
苹果可折叠手机新专利 掉落时可自动折叠保护屏幕_今日热议
苹果可折叠手机新专利掉落时可自动折叠保护屏幕
-
环球热推荐:万润科技(002654)3月17日13点0分触及涨停板
3月17日盘中消息,13点0分万润科技(002654)触及涨停板。目前价格5 9,上涨9 87%。其所属行业光学光电子目前上涨。领涨股为茂莱光学。该股为
-
利润翻倍,宁德时代为何高兴不起来?
3月9日晚,宁德时代发布2022年年报,公司2022年营业收入3285 94亿元,同比增长152 07%;扣非归母净利润282 13亿元,同比增长109 88%
-
知情人士透露,老虎环球管理去年减记其风投基金的投资约33%,导致价值缩水230亿美元
知情人士透露,老虎环球管理去年减记其风投基金的投资约33%,导致价值缩水230亿美元。这位人士表示,去年下半年减记约90亿美元。媒体周四早些
X 关闭
X 关闭