查询到最新的12条

对话大模型中的事实错误:ChatGPT 的缺陷

©PaperWeekly 原创 · 作者 | 愁云引言随着 ChatGPT 的横空出世,智能对话大模型俨然已成为 AI 发展的焦点,更是在整个自然语言处理 (NLP) 领域掀起了一阵海啸。自去年席卷全球以来便引起各行各业空前的热度,数亿用户纷纷惊叹于 ChatGPT 的强大功能,思考其背后关键技术革新,也关注当前 ChatGPT 仍存在哪些缺陷,除了巨量数据资源的耗费需求,无法与时俱进关联最新信息等 继续阅读

还能承认错误,这个AI要杀疯了...

距离我上一篇文章提到ChatGPT,到现在,它又火了好几度,最新的口号是:关于 AI 的问题,可以直接问 AI, ChatGPT号称可以回答后续问题,承认错误,挑战不正确的前提,还能帮你修改代码中的 bug…… 然后我试了下 「我刚刚与 ChatGPT 就现代物理学的历史进行了大约 20 分钟的对话。如 果我在高中和大学期间有这样一位老师……OMG。我认为 继续阅读

ChatGPT国产化:ChatYuan元语对话大模型升级

国产自研功能对话大模型元语 ChatYuan 于 2022 年 12 月发布测试版本后,引起社会各界人士的广泛讨论,并且收到了用户的大量反馈和宝贵建议。元语智能团队已于近日对元语 ChatYuan 进行了模型效果优化和版本功能升级,现已开放内测。,时长01:12--ChatYuan 和 ChatGPT 首次对话 --(建议全屏观看)版本升级内容【支持多次编辑】第一次输入后,可以进一步提出要求&#xf 继续阅读

国产大模型已无公司可投

大模型创投市场,来到了“无公司可投”的新阶段。 创业者想要钱,但新轮次大额融资越来越难;投资人难以寻求合适的标的,看得中的投不上、投得起的看不上。 这样的现象既在意料之外,又实属情理之中。 万箭齐发小半年,普通人对AI与大模型的使用频率下滑,当激情趋于平缓,就连领头羊ChatGPT的访问量增速都开始放缓。 但这个赛道的卷和拥挤远未停歇: 作为最早一批AI初创公司&#xf 继续阅读

【类ChatGPT】本地CPU部署中文羊驼大模型LLaMA和Alpaca

昨天在github上看到一个在本地部署中文大模型的项目,和大家分享一下。先把地址po出来。 项目名称:中文LLaMA&Alpaca大语言模型+本地部署 (Chinese LLaMA & Alpaca LLMs) 项目地址:https://github.com/ymcui/Chinese-LLaMA-Alpaca 以下是原github中给出的体验GIF,可以看到这个模型还是具备一定的指令理解和上下文对话能力的。 继续阅读

中科院张家俊:ChatGPT中的提示与指令学习

中国科学院自动化研究所研究员张家俊以ChatGPT中的提示与指令学习为题,从ChatGPT简要技术回顾、迈向通用性的提示学习、从提示学习到指令学习、相关探索与学习等角度和在场听众展开技术分享。大模型主要有两个方向,一个是“预训练+参数微调”,就是大模型有了之后针对下游任务进行微调,然后得到一个面向下游任务的大的模型,二是“预训练+提示学习”,预训练之后不变,用提示学习激发大模型来 继续阅读

课代表:ChatGPT及大模型专题研讨会

课代表:ChatGPT及大模型专题研讨会 周末应领导的要求听了一下午的直播(什么时候能不再做领导对啥感兴趣你就要每天围着什么转的牛马呢?),一打开还看到了自己本科的老师(死去的记忆突然攻击我)。既然做都做了,还是有些结果比较好,简单分享一下我的笔记和一些思考 以ChatGPT为代表的对话式大型语言模型 模型角度:具备涌现能力的模型(目前 继续阅读

ChatGPT爆火的背后,到底是什么在跟我们对话?

2022年11月底美国人工智能研究实验室OpenAI新推出的一种人工智能技术驱动的自然语言处理工具——ChatGPT聊天机器人。一经推出便迅速在社交媒体上走红,成为AI领域最炙手可热的话题,掀起了新一轮的人工智能浪潮。 ChatGPT不单是聊天机器人,它会通过连接大量的语料库来训练模型,这些语料库包含了真实世界中的对话,使得ChatGPT具备上知天文下知地理,还能根据聊天的上下文进行互动的能力,能 继续阅读

字符串函数中的求长度、查找、分割和错误报告函数(strlen,strstr,strtok,strerror)

文章目录一、strlen - 求字符串长度1.函数介绍2.模拟实现(三种方式)二、strstr - 字符串查找1.函数介绍2.模拟实现三、strtok - 字符串分割四、strerror、perror - 错误报告函数1.strerror2.perror 一、strlen - 求字符串长度 1.函数介绍 size_t strlen( const char *string ); strlen函数是一个用于求字符串长度的库函数。它的参数是被求长度的字符串的 继续阅读

微软的 LLM-Augmenter 提高了 ChatGPT 的事实答案分数(教程含源码)

在发布后的三个月里,ChatGPT 能够对范围广泛的问题生成类似人的、连贯的和信息丰富的回答,这使得 OpenAI 对话式大型语言模型 (LLM) 从好奇变成了吸引公众讨论 AI 优缺点的磁石。虽然有很多赞誉,但也有严重的担忧——特别是关于 ChatGPT 偶尔产生误导性或事实不正确的反应,这被描述为“幻觉”。这些担忧以及 ChatGPT 无法访问互联网来更新其知识,导致一些人认为此类 LLM 还没有为现实世界的关键任务应用程序做好准备。 在新论文Check Your Facts and Tr 继续阅读