首个金融垂直领域大语言模型

查询到最新的12条

BloombergGPT: 首个金融垂直领域大语言模型

2023-08-18 0 Comment

BloombergGPT: 首个金融垂直领域大语言模型 Bloomberg 刚刚发布了一篇研究论文，详细介绍了他们最新的突破性技术 BloombergGPT。BloombergGPT是一个大型生成式人工智能模型，专门使用大量金融数据进行了训练，以支持金融行业自然语言处理 (NLP) 任务。随着ChatGPT的发布，人工智能取得了长足进步。但金融领域相当复杂且独特的领域，它往往受着严厉的合规监管，对事实正确继续阅读

国内首个类 ChatGPT 模型：复旦大学 MOSS 今日正式开源，RTX 3090 显卡可运行

2023-08-19 0 Comment

4 月 21 日消息，复旦大学自然语言处理实验室开发的新版 MOSS 模型今日正式上线，成为国内首个插件增强的开源对话语言模型。目前，MOSS 模型已上线开源，相关代码、数据、模型参数已在 Github 和 Hugging Face 等平台开放，供科研人员下载。据介绍，MOSS 是一个支持中英双语和多种插件的开源对话语言模型，moss-moon 系列模型具有 160 亿参数&# 继续阅读

ChatLaw：中文法律大模型

2023-09-24 0 Comment

文章目录 Abstract1. Introduction2. Dataset3. Training Process3.1 ChatLaw LLM3.2 Keyword LLM3.3 Law LLM 4. Experiment and Analysis5. Conclusions Abstract LLM已经展现出在各个领域彻底改变自然语言处理任务的潜力，引发了人们对特定于垂直领域的大模型的极大兴趣。然而，与BloombergGPT和Fi 继续阅读

深入解析大型语言模型：从训练到部署大模型

2023-09-30 0 Comment

简介随着数据科学领域的深入发展，大型语言模型—这种能够处理和生成复杂自然语言的精密人工智能系统—逐渐引发了更大的关注。 LLMs是自然语言处理（NLP）中最令人瞩目的突破之一。这些模型有潜力彻底改变从客服到科学研究等各种行业，但是人们对其能力和局限性的理解尚未全面。 LLMs依赖海量的文本数据进行训练，从而能够生成极其准确的预测和回应。像GPT-3和T5这样的LLMs在诸如语言翻译、问答、以及摘要等多个NLP任务中已经继续阅读

通过百度文心一言大模型作画尝鲜，感受国产ChatGPT的“狂飙”

2023-07-19 0 Comment

3月16日下午，百度于北京总部召开新闻发布会，主题围绕新一代大语言模型、生成式AI产品文心一言。百度创始人、董事长兼首席执行官李彦宏，百度首席技术官王海峰出席，并展示了文心一言在文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。从现场展示来看，文心一言某种程度上具有了对人类意图的理解能力，回答的准确性、逻辑性、流畅性都逐渐接近人类水平。但李彦宏也多次提及，这类大语言模型继续阅读

【自然语言处理】【大模型】Chinchilla：训练计算利用率最优的大语言模型

2023-10-05 0 Comment

Chinchilla：训练计算利用率最优的大语言模型《Training Compute-Optimal Large Language Models》论文地址：https://arxiv.org/pdf/2203.15556.pdf 一、简介近期出现了一些列的大语言模型(Large Language Models, LLM)，最大的稠密语言模型已经超过了500B的参数。这些大的自回归transformers已经在各个任务上展现继续阅读

ChatGPT基础知识系列之大型语言模型(LLM)初识

2023-09-15 0 Comment

ChatGPT基础知识系列之大型语言模型(LLM)初识 ChatGPT本质是一个对话模型，它可以回答日常问题、挑战不正确的前提，甚至会拒绝不适当的请求，在去除偏见和安全性上不同于以往的语言模型。ChatGPT从闲聊、回答日常问题，到文本改写、诗歌小说生成、视频脚本生成，以及编写和调试代码均展示了其令人惊叹的能力。在OpenAI公布博文和试用接口后，ChatGPT很快以令人惊叹的对话能力“引爆”网络，本文主要从技术角度，梳理ChatGPT背后涉及的技术工作LLM，来阐述其如此强大的原因；同时思考继续阅读