转载声明:文章来源:https://blog.csdn.net/weixin_46575696/article/details/130005404
什么是ChatGPT
ChatGPT全称为“chat Generative Pre-trained Transformer”,翻译成中文就是生成型预训练变换模型。它是美国公司OpenAI在2022年11月30日发布研发的聊天机器人程序,能用于问答、文本摘要生成、机器翻译、分类、代码生成和对话AI。是一款人工智能技术驱动的自然语言处理工具。
ChatGPT具有同类产品具备的一些特性,例如对话能力,能够在同一个会话期间内回答上下文相关的后续问题。然而,其在短时间内引爆全球的原因在于,在网友们晒出的截图中,ChatGPT不仅能流畅地与用户对话,甚至能写诗、撰文、编码
ChatGPT还采用了注重道德水平的训练方式,按照预先设计的道德准则,对不怀好意的提问和请求“说不”。一旦发现用户给出的文字提示里面含有恶意,包括但不限于暴力、歧视、犯罪等意图,都会拒绝提供有效答案。
ChatGPT推出仅仅2个月,就达到月活过亿,成为历史上增长最快的消费者应用程序。与其他流行应用程序相比,这一增长令人印象深刻,如TikTok在全球推出后用约9个月时间达到1亿用户,Instagram花了2.5年。
ChatGPT的应用领域
ChatGPT主要应用的大规模预训练语言模型技术,在金融行业的不少细分领域都已有所应用。例如,对公告和研报等数据进行结构化处理,提高数据生产效率;对海量资讯进行监测和筛选,发掘有价值的投资信息;对智能客服进行训练,使其更加精准有效地解决客户提问等。
ChatGPT在金融领域的确应用广泛,也能极大提升使用者的效率。甚至不久的将来,随着技术进步,信息更新、回答准确性、算力成本等因素无法再掣肘,ChatGPT在一些领域将能实现从“效率工具”到“生产工具”的突破,进而彻底取代一些重复性、基础性的人力工作。
不过,尽管ChatGPT已可进行一定的内容生产,可仍需依赖使用者精心设计的提问来运作,产出内容通常还存在诸多不足。有分析师总结为:ChatGPT的回答更像是市场一致预期的精准表达,难免囿于“重复正确的废话”之嫌。
有分析师也曾尝试基于ChatGPT的协助去构建量化交易模型,但最终结论是想单纯依靠ChatGPT给出的模型开发成熟的、可盈利的策略是不切实际的,因为其给出的模型相对简单,且无法对数据进行分析,参数设置也缺乏逻辑支持。
ChatGPT的原理
起名 "ChatGPT" 的原因是,这个模型是预先训练过的,专为对话和生成文本而设计,并使用 Transformer 架构。因此,"Chat" 表示它是一个对话模型,"GPT" 则代表了它是使用 Generative Pretrained Transformer 架构构建的。
Generative Pretrained Transformer(GPT)是一种自然语言生成模型,是以训练数据预训练语言模型的技术。GPT 是基于 Transformer 架构,是目前最流行的自然语言生成模型之一。GPT 的网络结构包括一个序列处理模块(例如词嵌入层),多个编码器和解码器层,以及一个预测层。该模型通过对大量的历史文本数据进行预训练,学习了语言和语法的特征。这使得 GPT 在生成文本任务(例如语音识别、翻译和对话生成)中取得了出色的效果。
在训练过程中,GPT 预测下一个词的概率,根据该预测和原始文本的预期输出进行评估,并通过反向传播算法调整模型的参数。GPT 的主要优势在于它的可解释性和它的生成质量。因此,GPT 被广泛用于自然语言处理应用,例如语音识别、翻译和对话生成。
Transformer 架构是一种用于自然语言处理任务的深度神经网络架构,首次提出于 2017 年。它采用了注意力机制,可以解决序列数据中的长依赖性问题。
Transformer 架构最大的特点是它的自注意力机制,它可以学习词语之间的关系,并综合不同位置的词语,得出整个序列的含义。这种机制使得 Transformer 架构可以并行地处理整个输入序列,从而加速训练和推理过程。
Transformer 架构在 NLP 领域取得了显著的成功,并已经成为大多数 NLP 任务的首选架构。它们可以被用于情感分析、机器翻译、语音识别等任务。
总的来说,Transformer 架构是一种用于自然语言处理任务的高效和强大的架构,它已经在实际应用中取得了很大的成功。
ChatGPT如何进行预训练
预训练是机器学习中的一种方法,它指的是使用大量的预先数据训练一个模型,使其能够从数据中学到一些基础知识和模式,并将这些知识用于更加特定的任务。 预训练可以使用大量的文本数据,例如网络文本、书籍、新闻等,对于计算机视觉、语音识别和自然语言处理等领域的任务,可以使用大量的图像、音频和语音数据进行预训练。预训练的模型可以使用迁移学习的方法被用于其他任务,可以在训练数据不够多的情况下提高模型的性能。
通常,预训练模型在大量数据上被训练一个极大的多层网络,然后将其微调以适合特定的任务。预训练和微调的技术是深度学习领域的重要技术,在很多领域中取得了显著的成果。
ChatGPT 与其他AI最大的区别
ChatGPT 与其他 AI 的最大区别在于它是一种基于 Transformer 架构的生成式预训练模型。ChatGPT 是通过预先训练在大量文本数据上,以生成文本为目标,来学习文本生成任务的模型。这种方法与其他机器学习方法最大的不同之处在于,它是在没有任何特定任务目标的情况下,通过预先学习整个语言模型的方法,然后再在特定的任务上调整模型的参数。相比其他 AI,ChatGPT 具有更高的语言理解能力,更好的语言生成能力,以及更高的适应性。
影响ChatGPT思考逻辑的因素
ChatGPT作为一种自然语言处理技术,其逻辑主要受以下几个因素影响:
训练数据:ChatGPT 是通过大量的训练数据预先学习了语言和语法知识,因此如果训练数据中存在错误或偏差,则可能影响 ChatGPT 的逻辑思考。
语境信息: ChatGPT 运用上下文信息来理解语句的意思,因此如果语境不足或者语境信息有误,也可能影响 ChatGPT 的逻辑思考。
算法本身的局限:尽管ChatGPT模型具有很高的准确性和智能性,但由于其是基于机器学习算法的,因此也存在一定的局限性。
总的来说, ChatGPT 的逻辑思考受到语言环境、语境信息、训练数据以及算法本身局限的影响。因此,在使用 ChatGPT 时需要注意一些因素,以保证它的逻辑思考尽量准确。
ChatGPT的中文与英文训练数据
ChatGPT的中文和英文训练数据不一样,他们分别以中文和英文为基础使用不同的语言数据集进行训练。中文版本的ChatGPT训练了大量中文文本,而英文版本的ChatGPT则使用了大量的英文文本。这样做是为了确保模型可以更好地理解并生成对应的语言。
用于ChatGPT 训练的数据格式
通常,ChatGPT 的训练数据是以文本形式提供的。这些文本数据可以是网页、新闻、书籍、对话等。这些文本数据可以经过预处理以获得最佳的训练效果,例如:清理噪音数据、替换链接和数字、标准化语法等。
此外,还可以使用其他格式的数据,例如:音频、图像等,但这通常需要先将它们转换为文本形式,再作为训练数据。
ChatGPT的发展历程
2022年11月底,人工智能对话聊天机器人ChatGPT推出,迅速在社交媒体上走红,短短5天,注册用户数就超过100万。
2023年1月4日,微软公司正计划推出新版必应搜索引擎,使用聊天机器人ChatGPT背后的人工智能(AI)技术。
2023年1月28日,人工智能聊天机器人ChatGPT已经被亚马逊用于许多不同的工作职能中,包括回答面试问题、编写软件代码和创建培训文档等。一名员工在Slack上表示,亚马逊Amazon Web Services(AWS)云部门已经成立了一个小型工作组
以更好地了解人工智能对其业务的影响。通过测试,该团队发现ChatGPT在回答AWS客户支持问题方面“做得非常好”。
据英国《每日邮报》报道,2023年1月30日,哥伦比亚加勒比市的法官加西亚成为全球第一位在法律裁决工作中利用ChatGPT的法官。在审理一宗自闭症儿童家庭诉保险公司的案件中,加西亚请ChatGPT列出了全国早前同类案件的判例,并引述
相关法律条条文。最终,结合自己的观点和ChatGPT的回答,法官加西亚做出了判决。
2023年2月2日,美国人工智能(AI)公司OpenAI发布ChatGPT试点订阅计划——ChatGPT Plus。ChatGPT Plus将以每月20美元的价格提供,订阅者可获得比免费版本更稳定、更快的服务,及尝试新功能和优化的优先权。
2023年2月2日,微软官方公告表示,旗下所有产品将全线整合ChatGPT,除此前宣布的搜索引擎必应、Office外,微软还将在云计算平台Azure中整合ChatGPT,Azure的OpenAI服务将允许开发者访问AI模型。
2023年2月3日,IT 行业的领导者们担心,大名鼎鼎的人工智能聊天机器人 ChatGPT,已经被黑客们用于策划网络攻击时使用。 黑莓 (Black Berry) 的一份报告调查了英国 500 名 IT 行业决策者对 ChatGPT 这项革命性技术的看法,发现超过四分之三(76%) 的人认为,外国已经在针对其他国家的网络战争中使用 ChatGPT。近一半 (48%) 的人认为,2023 年,将会出现有人恶意使用 ChatGPT 而造成“成功”的网络攻击
2023年2月3日,ChatGPT的开发公司——美国人工智能公司OpenAI顺势推出了这一应用程序的付费订阅版本——ChatGPT Plus。ChatGPT Plus将以每月20美元的价格提供,订阅者可获得比免费版本更稳定、更快的服务,及尝试新功能和优化的优先权。
2023年2月4日消息,以色列总统艾萨克·赫尔佐格(Isaac Herzog)周三发表了部分由人工智能(AI)撰写的演讲,成为首位公开使用ChatGPT的世界领导人
2023年2月7日,微软宣布推出由ChatGPT支持的最新版本人工智能搜索引擎Bing(必应)和Edge浏览器。微软CEO表示,“搜索引擎迎来了新时代”。
2023年2月8日凌晨,在华盛顿雷德蒙德举行的新闻发布会上,微软宣布将OpenAI传闻已久的GPT-4模型集成到Bing及Edge浏览器中,微软称之为“普罗米修斯模型”,并表示它比GPT 3.5更强大。
ChatGPT爆火的原因
南开大学计算机学院、网络空间安全学院副院长刘晓光认为,ChatGPT之所以能够突然爆火,可能有这样几个原因:“一是此前几代GPT更多是面向商界提供技术支持,而ChatGPT则是直接面向大众,谁都可以提问,回答也只需等几秒,更多的人能简单而直观地了解它的作用;二是它发布时正值国外的大学考试季,很多学生拿它写论文、交作业,而ChatGPT能给出相对完整的回答,解决了学生的实际问题,由此迎来用户快速增长。当然,它火热到一定程度后,也不排除有科技巨头企业、科技媒体的过度关注和一些炒作现象。”
ChatGPT带来的变革
ChatGPT横空出世,发展速度迅疾,用户注册破亿所用时间打破了TikTok在美国的记录,带热了整个AIGC概念。
ChatGPT对于整个人工智能相关行业是一个极大的鼓舞,对于人工智能行业的科技公司和从业者来说,都有必要深入地思考未来在技术生态链中的定位,以及公司未来在研究方向和业务应用方向的定位与布局。
ChatGPT代表了未来AI的发展趋势。
与传统的语音交互、图像识别等AI应用类似,ChatGPT也是一种人机交互。人通过文字和机器对话,获得内容。但ChatGPT的突破之处在于,它可以基于大数据集自己生成内容,而不是简单的比对和匹配。这意味着AI掌握了一定的自学习能力,技术迭代的速度大幅提升。
在所谓的AI 1.0时代,人们使用语音交互时,获得的内容是技术人员提前预设的,AI只是在海量数据库中做快速比对,如果数据库中并没有对应内容,AI无法自己生成内容。因此,ChatGPT的诞生也被市场认为是AI 2.0时代到来的象征,未来会影响到各行各业。
新一代操作系统平台的雏形
多语言撰写充满想象力的诗歌,编写可运行的程序,快速生成论文摘要,自动制作数据表格,纠正文章中的语法和表达错误,把一周大事写成新闻综述……ChatGPT不仅能理解很多人类问题和指令,流畅展开多轮对话,也在越来越多领域显示出解决多种通用问题的能力。
ChatGPT还轻松通过一些对人类难度较高的专业级测试:它新近通过了谷歌编码L3级(入门级)工程师测试;分别以B和C+的成绩通过了美国宾夕法尼亚大学沃顿商学院MBA的期末考试和明尼苏达大学四门课程的研究生考试;通过了美国执业医师资格考试……业界形容它的诞生是人工智能时代的“iPhone时刻”,意味着人工智能迎来革命性转折点。
“ChatGPT的成功不应仅仅被看作新一代聊天机器人的突破,而应该重视其对人工智能乃至整个信息产业带来的革命。”北京智源人工智能研究院院长黄铁军接受记者专访时说,人工智能领域的过去十年是深度学习的十年,但产业总体上并没有出现移动互联网和云计算级别的爆发,“ChatGPT的出现,具有划时代意义,大模型+ChatGPT已形成新一代操作系统平台的雏形”。
黄铁军说,ChatGPT在技术路径上采用了“大数据+大算力+强算法=大模型”路线,又在“基础大模型+指令微调”方向探索出新范式,其中基础大模型类似大脑,指令微调是交互训练,两者结合实现逼近人类的语言智能。ChatGPT应用了“基于人类反馈的强化学习”训练方式,用人类偏好作为奖励信号训练模型,促使模型越来越符合人类的认知理解模式。
“这样的AI可帮助人类进行真实创造,尤其是帮助人类提高创造效率,比如提高获取信息的效率或提出新颖想法,再由人解决其真实性问题。创造效率的提高将产生巨大效益和多方面影响,可以改变世界信息化格局。”中国科学技术大学机器人实验室主任陈小平对记者说。
引发新一轮人工智能科技竞赛
ChatGPT的问世正在人工智能领域引发新一轮科技竞赛。北京时间2月8日凌晨,微软推出由ChatGPT支持的最新版本必应搜索引擎和Edge浏览器,宣布要“重塑搜索”。微软旗下Office、Azure云服务等所有产品都将全线整合ChatGPT。
北京时间2月7日凌晨,谷歌也发布了基于谷歌LaMDA大模型的下一代对话AI系统Bard。同一天,百度官宣正在研发的大模型类项目“文心一言”,计划在3月完成内测,随后对公众开放。阿里巴巴、京东等中国企业也表示正在或计划研发类似产品。
人工智能大模型领域的全球竞争已趋白热化。黄铁军认为,ChatGPT未来有望演变成新一代操作系统平台和生态。这种变革似移动互联网从个人电脑到手机的转化,大部分计算负荷将由大模型为核心的新一代信息基础设施接管。这一新范式将影响从应用到基础设施各层面,引发整个产业格局的巨变,大模型及其软硬件支撑系统的生态之争将成为未来十年信息产业焦点。
值得注意的是,ChatGPT有时会“一本正经地胡说八道”,存在事实性错误、知识盲区和常识偏差等诸多问题,还面临训练数据来源合规性、数据使用的偏见性、生成虚假信息、版权争议等人工智能通用风险。多家全球知名学术期刊为此更新编辑准则,包括任何大型语言模型工具都不会被接受为研究论文署名作者等。
“学术论文的署名作者须满足至少两个条件,其一是在论文工作中做出‘实质性贡献’,其二是能承担相关的责任。目前这两个条件ChatGPT(以及其他AI系统)都不满足。”陈小平说。
ChatGPT也有应用在舆论信息战方面的潜力。加拿大麦吉尔大学研究团队曾使用ChatGPT前代模型GPT-2阅读加拿大广播公司播发的约5000篇有关新冠疫情的文章,然后要求其生成关于这场危机的“反事实新闻”。连OpenAI也警告使用ChatGPT的用户,它“可能偶尔会生成不正确的信息”,“产生有害指令或有偏见的内容”。
“针对这些问题,需要我们在发展技术的同时,对于ChatGPT应用边界加以管控,建立起对人工智能生成内容的管理法规,对利用人工智能生成和传播不实不良内容进行规避。同时加强治理工具的开发,通过技术手段识别人工智能生成内容。这对于内容检测和作品确权,都是重要前提。”北京瑞莱智慧科技有限公司副总裁唐家渝说。
“出主意”式产业变革
如果说此前的信息和大数据技术,例如基于信息搜索的互联网系统,本质上是执行工具,也就是按决策人的指令提供所需信息,其所具有的人工智能主要体现为“听指令”高效行事,那么ChatGPT则转变为可以“出主意”的帮手。
一旦实现“听指令”向“出主意”的决定性飞跃,就可以向“担主角”的方向发展。凭借其强大的数据处理能力,在与人的信息交换中,ChatGPT所出的“主意”,例如咨询意见、设计方案、客户沟通、文稿创作等,可不断提高这些工作的质量。在任何特定领域,ChatGPT所提供的“主意”如果成为富有建设性的意见,且难有更高水平的方案替代,那么ChatGPT实际上就具备了一定的决策功能。“帮手”不仅可以出主意,而且能够拿“主见”。
这样,引入了ChatGPT的产业及职业行为就有可能发生实质性变化,发生职能转换。智能机器人的主动性将更强。其操控者则“坐享其成”,似乎可以进入美好的舒适境界,让生活变得更加便捷。
而当ChatGPT有了很强的主动性,就可以因变应变,对外部变化作出积极响应。这样,人工智能技术就发展成为具有主动功能的人工智能体,从而为经济发展注入新动能、增添新活力。
此时,生产会越来越多地具备人工智能体形态的行为主体。这类新形态的行为主体,遵循新的组织行为规则,其权责边界和供求关系都将产生一系列新现象、新问题。人工智能体创造各种“主意”,使用大量来源广泛的知识资源,那么这些“主意”所涉及的知识产权如何界定?其行为表现及后果与相关自然人法人之间的法律责任如何确定?这些问题都会成为值得关注的焦点。
例如,如果医院门诊的大多数功能,像挂号候诊、检查检验、病情诊断、医嘱处方等都可以由人工智能体承担,那主诊医生与人工智能体的职能划分和权责关系如何界定?特别是人工智能体如果达到诊断差错率显著地低于主诊医生误诊率的水平,那处方权应归谁?在更多的行业都将发生类似现象。对此,须有新的规则来维护新的秩序。
ChatGPT在技术上激发和导致人工智能体的主动化和主体化,各类产业和职业形态就有望朝着软件技术和硬件技术深度融合的方向发展。在许多领域,人工智能体不仅“出主意”“拿主见”,而且要“言必行”“行必果”。例如,如果不满足于仅仅跟ChatGPT泛泛聊天谈饮食,要求人工智能体建议最合适的食谱,而且能够烹调供食,那么软件和硬件的融合就可能成为餐饮和家政等产业新的发展方向。
可以预见,未来大多数产业的发展都将融入人工智能技术。以硬件设备为主体的产业,例如制造业、采掘业、基础设施等,将更多加入人工智能软件系统;以软件和人力为主的产业,比如各类服务业将更多加入人工智能设备来替代人工。这些产业新形态的出现,自然是不难预见的前景,人们的生活将因之而变。
社会各界对于ChatGPT的态度
2022年年12月,埃隆·马斯克曾公开表示ChatGPT“好得吓人”(scary good),并认为强大到危险的人工智能已经离我们不远。微软联合创始人比尔·盖茨接受媒体采访时表示:“ChatGPT将改变我们的世界。”
一项调查显示,截止2023年1月,美国89%的大学生都是用ChatGPT做作业。
2023年1月,巴黎政治大学(Sciences Po)宣布,该校已向所有学生和教师发送电子邮件,要求禁止使用ChatGPT等一切基于AI的工具,旨在防止学术欺诈和剽窃。
2023年2月10日,比尔·盖茨在接受德国媒体采访时表示,聊天机器人ChatGPT可以对用户查询做出惊人的类似人类的反应,其重要性不亚于互联网的发明。“到目前为止,人工智能可以读写,但无法理解内容。像ChatGPT这样的新程序将通过帮助开收据或写邮件,提高办公效率。这将改变我们的世界。”盖茨说道。ChatGPT的“聪明”,也让不少人开始担忧,未来也许将有越来越多的职业被人工智能取代。对此,盖茨却认为,人工智能不会产生如此威胁,“教师不会减少,医生也不会减少。”谈及未来哪些行业将受到最大影响时,盖茨表示,随着机器人变得更加智能,人们主要需要关注进行体力操作的蓝领工作。“正在发生的情况是,在工厂内部,机器人正变得更好,我们可以让蓝领的工作效率更高。”但在盖茨看来,这并不意味着人将被机器全面取代。“就像AI可以帮助老师完成他们的工作一样,我认为我们不会减少老师数量,但是AI可以帮助那些老师,我也不认为我们会减少医生的数量,但AI可以帮助他们减少超负荷的工作并做得更好。”
2023年2月,纽约市和西雅图市的公立学校系统,以及纽约大学等高校的校内设备和局域网已经全面禁止了ChatGPT的使用。一名来自普林斯顿大学的计算机系大四学生甚至研究出了一款名为GPTZero的反作弊软件,只需输入学生提交的作业内容,便可鉴别出是否由ChatGPT代劳。从1月3日上线至今,全美已有40个州超过23000名教师注册了这一网站。
李开复2023年2月13日微博:“后ChatGPT时代”如果你从事的工作不太能打又该怎么办呢?别着急,在《AI未来进行式》一书中,我通过故事和讲解给出了三大生存攻略,在英文简称三个R:Relearn二次学习,Recalibrate 二次定义,Renaissance 二次复兴。愿这3个法则助你打赢ChatGPT。ChatGPT引发的“人类末日论”喧嚣尘上,我认为,AI不仅是科技进步的产物,更是帮助人类进步发展、完善自我的利器。回顾人类历史,过往的几次工业革命在推动人类社会进步的同时,也曾在各自的时代被不同程度地异化为“电车难题”。而历次工业革命的最终成果也告诉了我们“电车难题”的最佳答案:技术是中性的,它的用途完全取决于使用者自身。我们一方面需要让大众更了解AI带来的短期阵痛和长期效益;另一方面我们更需要共同努力,未雨绸缪积极应对。只有这样,我们才能在拥抱ChatGPT等AI技术进步的过程中,逐渐培养出负责任和严谨的态度,让AI真正地“Tech for Good ”造福人类。
2023年2月,京东集团副总裁何晓冬接受媒体采访时表示:“ChatGPT是第一款真正意义上的人工智能原生的产品,就像第一款iPhone,一出来就展现出高完整度,高体验性,高平台性。”
ChatGPT同类型产品
2023年2月7日,百度方面透露,该公司“类ChatGPT应用”将在3月份完成内测,该项目名称已被确定为“文心一言”(ERNIE Bot)。作为国内首家透露“类ChatGPT”项目的公司,百度方面还表示,目前文心一言在做上线前的冲刺。按照谷歌和微软节奏,文心一言开放内测还有可能提前。
2023年2月8日,阿里表示,阿里版聊天机器人ChatGPT正在研发中,目前处于内测阶段。钉钉方面也表示,阿里版本的ChatGPT的对话机器人将和钉钉深度结合。360、京东、网易有道陆续表态,已开发或计划开发类ChatGPT相关产品。科大讯飞在投资者互动平台表示,类ChatGPT技术今年5月将率先落地AI学习机产品。
在ChatGPT上线公测后,据《纽约时报》报道,谷歌公司内部立即拉响“红色警报”。谷歌CEO皮查伊亲自主持召开多场应对会议,甚至请回谷歌的两位联合创始人拉里·佩奇和谢尔盖·布林共商对策。2023年2月8日,就在“必应”加持ChatGPT的同一天,谷歌火速将仍处于内部测试阶段的“预训练语言生成模型”巴德(BARD)进行线上和线下的产品展示。但没想到,巴德却连连出错。在谷歌发布的视频演示中,一位用户问巴德:“我可以告诉我9岁的孩子关于詹姆斯·韦伯太空望远镜的哪些新发现?”巴德给出的一个回答是这样写的:“JWST(詹姆斯·韦伯空间望远镜)拍摄了太阳系外行星的第一张照片。”然而,这是一个低级的事实错误。根据美国航空航天局的说法,第一张显示系外行星的照片实际上是由欧洲南方天文台(VLT)的甚大望远镜在2004年拍摄的。同日,在巴黎举行的巴德演示会再次出现“意外”。谷歌搜索引擎部负责人里德(LIZREID)在现场展示巴德的“多项搜索”功能时居然弄丢了用来做演示的手机。谷歌“巴德”接连出糗后,2月8日当天,谷歌母公司Alphabet的股价暴跌7.7%,市值蒸发1000亿美元。
2023年2月20日,从复旦大学自然语言处理实验室获悉,国内第一个对话式大型语言模型 Moss 已由邱锡鹏教授团队发布至公开平台(https://Moss.fastnlp.top/) ,邀公众参与内测。如今,Moss 成为国内首个公开亮相的类 ChatGPT 语言模型,「端到端」走通了大语言模型的开发全程。复旦团队则采用不同的技术路线,通过让 Moss 和人类以及其他对话模型都进行交互,显著提升了学习效率和研发效率,短时间内就高效完成了对话能力训练。
帖子还没人回复快来抢沙发