16k模型 - 个人博客

查询到最新的12条

【类ChatGPT】本地CPU部署中文羊驼大模型LLaMA和Alpaca

2023-10-02 0 Comment

昨天在github上看到一个在本地部署中文大模型的项目，和大家分享一下。先把地址po出来。项目名称：中文LLaMA&Alpaca大语言模型+本地部署 (Chinese LLaMA & Alpaca LLMs) 项目地址：https://github.com/ymcui/Chinese-LLaMA-Alpaca 以下是原github中给出的体验GIF，可以看到这个模型还是具备一定的指令理解和上下文对话能力的。继续阅读

国内用户轻松训练类ChatGPT等大语言模型，使得人人都能拥有自己的ChatGPT！

2023-09-01 0 Comment

4月12日，微软宣布开源了Deep Speed Chat，帮助用户轻松训练类ChatGPT等大语言模型，使得人人都能拥有自己的ChatGPT！（国内chatgpt平台阿猫智能机器人项目合作地址：3AMaoGptChat, AI, APIhttp://1search.top/ 据悉，Deep Speed Chat是基于微软Deep Speed深度学习优化库开发而成，具备训练、强化推理继续阅读

【自然语言处理】【大模型】DeepMind的大模型Gopher

2023-09-21 0 Comment

DeepMind的大模型Gopher 《Scaling Language Models: Methods, Analysis & Insights from Training Gopher》论文：https://arxiv.org/pdf/2112.11446.pdf 一、简介使用自然语言进行交流是智能的核心，因为其可以在人类和人工智能系统之间有效地分享想法。语言的普遍性使我们能够使用自然语言输入来表达许多智能任务，并产生继续阅读

ChatGPT国产化：ChatYuan元语对话大模型升级

2023-09-20 0 Comment

国产自研功能对话大模型元语 ChatYuan 于 2022 年 12 月发布测试版本后，引起社会各界人士的广泛讨论，并且收到了用户的大量反馈和宝贵建议。元语智能团队已于近日对元语 ChatYuan 进行了模型效果优化和版本功能升级，现已开放内测。，时长01:12--ChatYuan 和 ChatGPT 首次对话 --（建议全屏观看）版本升级内容【支持多次编辑】第一次输入后，可以进一步提出要求&#xf 继续阅读

讯飞星火认知大模型成果发布会举行

2023-08-30 0 Comment

目录一、提出通用人工智能七大维度481项评测体系二、讯飞星火认知大模型三大能力已超ChatGPT 现场语音输入流畅多维实测燃爆全场写邮件、做方案、讲故事，讯飞星火大模型到底有多会写？ 中文理解十级测试，现场观众：讯飞星火满分！ 大模型聪明与否看数学，讯飞星火数学能力远超过国内外大模型三、赋能教育、办公、汽车、数字员工讯飞星火认知大模型落地四大行业应用长篇大论不想看？口继续阅读

国产大模型已无公司可投

2023-08-21 0 Comment

大模型创投市场，来到了“无公司可投”的新阶段。创业者想要钱，但新轮次大额融资越来越难；投资人难以寻求合适的标的，看得中的投不上、投得起的看不上。这样的现象既在意料之外，又实属情理之中。万箭齐发小半年，普通人对AI与大模型的使用频率下滑，当激情趋于平缓，就连领头羊ChatGPT的访问量增速都开始放缓。但这个赛道的卷和拥挤远未停歇： 作为最早一批AI初创公司&#xf 继续阅读

大模型技术+研发情报库，智慧芽要打造研发版ChatGPT

2023-08-10 0 Comment

‍数据智能产业创新服务媒体——聚焦数智 · 改变商业ChatGPT引发了一次AI发展的高潮，并一定程度上让AI实现了破圈。目前，ChatGPT的全球用户已经超过1亿，在整个社会层面都引起了广泛的讨论。但同时，落地困难这个AI的老大难的问题，ChatGPT一样需要面对。探索垂直行业的应用场景，是ChatGPT实现商业化突破的一个重要方向。一方面，ChatGPT产品需要强大的底层大规模预训练模型技术&# 继续阅读

本地化部署AI语言模型RWKV指南，ChatGPT顿时感觉不香了。

2023-10-07 0 Comment

之前由于ChatGpt处处受限，又没法注册的同学们有福了，我们可以在自己电脑上本地化部署一套AI语言模型，且对于电脑配置要求也不是非常高，对它就是RWKV。关于RWKV RWKV是一个开源且允许商用的大语言模型，灵活性很高且极具发展潜力，它是一种纯 RNN 的架构，能够进行语言建模，目前最大参数规模已经做到了 14B，该模型训练由Stability赞助。本文发布时R 继续阅读

聊聊当下火热的通用人工智能--ChatGPT引爆的大模型时代

2023-08-31 0 Comment

前言目前人工智能领域实在是IT界火热的名字，使IT、互联网又火热了一把，与以往不同，这次着实让模型、算法、AI、大模型、超大规模训练、千亿级参数等不绝于耳。作为一个入门，下面进行一些简单的学习总结 ChatGPT——目前还只能是GPT ChatGPT（全名：Chat Generative Pre-trained Transformer），美国OpenAI 研发的聊天机器人程序& 继续阅读

ChatGPT 的工作原理：机器人背后的模型

2023-10-07 0 Comment

这篇对支持 ChatGPT 的机器学习模型的温和介绍，将从大型语言模型的介绍开始，深入探讨使 GPT-3 得到训练的革命性自我注意机制，然后深入研究人类反馈的强化学习，使 ChatGPT 与众不同的新技术。大型语言模型 ChatGPT 是一类被称为大型语言模型 (LLM) 的机器学习自然语言处理模型的外推。LLM 消化大量文本数据并推断文本中单词之间的关系。随着我们看到计算能力的进步，这些模型在过去几年中得到了发展。随继续阅读

ChatDoctor（LLM大模型用于医疗对话）

2023-09-12 0 Comment

ChatDoctor: A Medical Chat Model Fine-tuned on LLaMA Model using Medical Domain Knowledge paper：https://arxiv.org/pdf/2303.14070.pdf 通用领域中最近的大型语言模型 (LLM)，例如 ChatGPT，在遵循指令和产生类似人类的响应方面取得了显着的成功。但是语言模型并未针对医学领域量身定制，导致答案准确性较差继续阅读

Java内存模型final的内存语义

2023-09-28 0 Comment

上篇并发编程之Java内存模型volatile的内存语义介绍了volatile的内存语义，本文讲述的是final的内存语义，相比之下，final域的读和写更像是普通变量的访问。 1、final域的重排序规则final 对于final域编译器和处理器遵循两个重排序规则在构造函数内对一个final域的写入，与随后把这个对象的引用赋值给另一个引用变量，这两个操作之间不能重排序初次读一个包含final域的对象的引用，与随后初次读这个fi 继续阅读

擅长工具开发、爬虫采集技术、大数据统计处理！
座右铭：皇天不负有心人。

Search Results for: 16k模型