查询到最新的12条

ChatGPT的技术路线

目录ChatGPT的技术路线基于 GPT-3.5,GPT-4 预计提升更明显GPT、Bert 均源自 Transformer 模型领先的 NLP 模型RLHF 与 TAMER 是重要架构支撑 ChatGPT的技术路线 基于 GPT-3.5,GPT-4 预计提升更明显 ChatGPT 是基于 GPT-3.5 的主力模型。在互联网开源数据集上进行训练,引入人工数据标注和强化学习两项功能,实现“从人类反馈中强化学习”。相比之前的模 继续阅读

ColossalChat:使用完整的 RLHF Pipeline复现ChatGPT 的开源解决方案

        ChatGPT、GPT-4等大型AI模型和应用在全球范围内风靡一时,成为技术产业革命和AGI(Artificial General Intelligence)发展的基础。 不仅科技巨头竞相发布新品,许多来自学术界和产业界的人工智能专家也加入了相关的创业浪潮。 生成式 AI 每天都在快速迭代,不断完善!        然而,OpenAI 并没有将其模型开源,这让许多人对 继续阅读

活动推荐丨隐语开源社区 Meetup-开源一周年专场

凭借大数据、大算力的「大力出奇迹」,各类大模型「智能涌现」,再一次诠释了「数据是新时代的石油」。然而随着 ChatGPT 等各类大模型的应用,暴露出的隐私安全与数据要素流通问题引发广泛关注。数据流通与隐私安全的关键技术路径 —— 隐私计算技术和产业迎来突破发展新动力。 隐语开源一周年专场 Meetup 剧透 2022 年 7 月 4 日,隐语正式开源,至今已开源一周年啦 🎉 在开源一周年之际&#xff0c 继续阅读

ChatGPT中文网 - ChatGPT国内网页版在线使用

ChatGPT中文网是一个面向中国用户的聊天机器人网站,旨在为国内用户提供一个自然的环境、有趣、实用的聊天体验。它使用最新的自然语言处理技术来帮助用户更好地理解他们的聊天对话,还可以帮助用户解决日常生活中的问题,提供有趣的谈话内容以及实时信息服务。 ChatGPT中文网 网站 http://wenzhang.zhuluan.com/zh-cn/ 项目介绍: 任何 transformer 变体、任何数据集都通用。 在一块消费级 GP 继续阅读

APS开源引擎介绍

最近做排程项目,整理了一些开源的以及商业的引擎,运用好引擎其实可以简化开发,让开发人员可以专注于业务设计,以下整理的资料大多来自于维基百科和chatgpt,希望能对aps开发做一些帮助。 1 dream https://github.com/Nexedi/dream dream是开源制造业erp软件erp5的计划引擎,由欧洲公司nexedi研发,源于欧盟在先进制造技术领域的一个研究项目&#xf 继续阅读

当 ChatGPT 遇上开源容器安全工具集「问脉」

前言 看到最近铺天盖地的 ChatGPT 相关文章👀,作为一位爱刺激&爱冒险&好奇心强烈&动手能力强的安全技术爱好者(bushi)🤭,按捺不住躁动的灵魂,决定做一个简单的容器安全风险分析工具,指定参数即可调用 ChatGPT API,通过人工智能技术提供智能对话,获得完整可行的风险修复建议。 功能实现 开源容器安全工具集 继续阅读

ChatGPT 以及相关开源项目体验

本月初,ChatGPT 以惊人的速度问世,在技术圈中引起了广泛讨论。在 GitHub 上近期还诞生了多个 ChatGPT 相关的开源项目,数量之多令人瞠目结舌,甚至 ChatGPT 独霸了大半个 GitHub Trending,那么,它究竟有什么样的魅力,让诸多开发者如此激动不已呢?让我们一起来探究一下。注册目前& 继续阅读

ChatGLM-6B does not appear to have a file named config.

文章目录 代码调用演示效果实例一、问题二、场景说明三、error说明四、解决解决一解决二 ChatGLM-6B是一个由清华大学和智谱AI联合研发的开源对话语言模型。它是一个支持中英双语问答的对话系统,并在中文方面进行了特别的优化。 该模型基于General Language Model (GLM)架构,具有62亿参数。借助模型量化技术,用户可以在消费级的显卡上进行本地部署,INT4量化级别下最低只需6GB显存。ChatGLM-6B使用了和ChatGLM相同的技术,针对中文问 继续阅读

腾讯云部署清华大学ChatGLM-6B实战

简介(来自官方) ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。 ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 标识符 继续阅读

四大国内外开源的java工作流程引擎,流程快速开发平台对比分析选型

      为了更好的帮助大家找到适合自己的流程引擎,快速的完成流程引擎技术架构选型,快速的完成项目交付我们找到了4个开源的java工作流引擎,一些应用环境对比分析。 希望您能从中找到适合您自己的流程引擎。 工作流引擎 Activiti JBoss JBPM 6.5 JFlow 6.0 FixFlow 5.0 简介 Activiti是由jBPM 的创建Tom Baeyen离JBoss之后建立的项目,构建在开发 jBPM 版 继续阅读

音视频技术开发周刊 | 301

微软、谷歌、亚马逊,打响大模型时代的云战争 过去数月,云巨头们砸下真金白银,研发大模型、战略投资、自研 AI 芯片……大模型的时代方兴未艾,他们已经瞄准了新一代的 AI 软件客户。这篇文章围绕几大海外云巨头进行梳理,试图阐述“什么是今天云厂商们竞争的关键”。 北大开源首个中文法律大模型——ChatLaw 目前,ChatLaw法律大模型提供ChatLaw-13B、ChatLaw-33B和ChatLaw-Tex 继续阅读

「料见」vol25.回顾 | PKU-Beaver开源项目团队:一起来聊首个可复现的RLHF基准

为了解决复现RLHF技术和基于RLHF技术的大预言模型的不安全问题,北京大学团队开源了名为PKU-Beaver(海狸)开源项目。 第25期料见闭门分享会,我“门”非常开心邀请到PKU-Beaver开源项目团队成员——北京大学人工智能研究院助理教授 杨耀东 老师、北京大学在读博士生 吉嘉铭,来与大家分享项目介绍、近期情况,并与线上同学进行QA交流互动。 本次开源SafeRLHF第一轮的20k数据集&#xff 继续阅读