8月中旬拟发内测版!港中大(深圳)“凤凰”大语言模型来啦

2023-08-13 17:47:45 来源:南方都市报 分享到:

“我的英文写得不好,可以帮我把这篇论文润色一下吗?”

“向我的商科同学,用大白话解释一下什么是香农定理。”


(资料图片仅供参考)

……

这些需求,香港中文大学(深圳)自主研发的“凤凰”大语言模型都可以实现!

为了更好地满足香港中文大学(深圳)校内师生的学术与实践需求,香港中文大学(深圳)师生团队联合深圳市大数据研究院自主研发了一款名为“凤凰”的大语言模型,拟在8月中旬发布内测版。

“凤凰”大语言模型结合了全球领先的人工智能技术与校园教学、研究需求,是一款经过香港中文大学(深圳)校内数据科学团队精心研发的一项人工智能应用,旨在针对校内数据进行指令微调,为广大师生提供智能化、高效率的学习与研究支持。

灵感

从解决问题出发

进行个性化辅助

一切创新都源自生活,凤凰大语言模型的构想也是如此。据了解,“凤凰”大语言模型的灵感来源于今年5月香港中文大学(深圳)师生团队的课题小组讨论。

该校数据科学学院的青年教师王本友教授,了解到学生在处理海量学术数据和文献时遇到的困难,决定带领三位出色的学生共同探索一个解决方案,希望做出一款专属于校内师生的大语言模型,真正将人工智能与校园生活无缝地结合起来。他们构想着这样的场景:“我们可以开发一款专门用于校内的大语言模型,为校内师生提供个性化的智能学习和研究辅助,让学术探索更加高效和智能化!”

香港中文大学(深圳)大模型团队部分师生合照。

王本友教授介绍:“我们要从解决问题出发,把大模型语言做到专业且简单易用,未来将会打造专属于团队的大语言模型生态。”王本友教授在获得成熟的构思之后,立刻与博士生陈志鸿同学进行了可行性的沟通,并指导计算机科学与技术专业的本科生研究助理刘禹恒同学主导研究“凤凰”项目。

随后,团队招募了三位研究助理加入团队,他们分别是来自大数据科学专业的本科生欧阳恺瑞同学、张一笛同学和来自大数据研究院的研究助理宋定杰。他们融合各自的专业知识和热情,通宵达旦地研究、探索和迭代。经过数月的不懈努力,“凤凰”大语言模型拟在8月中旬发布内测版。

“凤凰”大语言模型学生团队,从左至右依次为:陈志鸿、刘禹恒、欧阳恺瑞、张一笛。

技术特点

秉持以数据为中心的计算方式

提供个性化有价值的交互体验

大模型发展到现在,研究从模型和算法转到了以数据为中心(Data-centric)。 Data-centric是一个新概念,该校研发团队秉持以数据为中心的计算方式,完成了数据工程,指令微调反馈学习和检索增强等一系列关键步骤。

为了让“凤凰”模型更好地适用于校园场景,该团队采用了渐进式的两阶段模型训练策略。首先,在通用语料上对模型进行了全参数量的指令微调,从而获得了与人类回复相一致的“凤凰”基础模型。在第二阶段,团队运用丰富多样的校内数据对模型进行了进一步的训练,让其学习学校相关的知识,理解学生和家长的问题意图,并能够提供更贴近校园教学和研究的回复,从而提升了模型在校园场景中理解并回答特定问题的能力。这样的训练策略确保了“凤凰”模型在校园环境中表现出色,为用户提供了更加个性化和有价值的交互体验。

为了进一步提高模型回答的正确性,团队在生成模型的基础上添加了检索器,设计了检索增强算法并将自研的混合检索算法结合,在模型生成的基础回答上,将数据库检索出的相关语料注入上下文语料,增强提示信息,生成更高准确性的回答。

应用场景

校园内有着广泛的应用场景

开发医疗健康领域大模型

“凤凰”大语言模型在校园内有着广泛的应用场景,包括但不限于:学术研究助力、科研项目支持、校园信息查询。

无论是实验设计还是数据分析,它都能为科研团队提供关键支持,推动创新成果的产出,让科研更加高效。对于论文写作,可以请求“凤凰”进行润色,让文章更加流畅。

以前,为了获取校园设施、行政流程、讲座讯息、教授研究领域、某个学院师资力量等方面的信息的资讯,师生可能需要在数十个校内公众号间来回切换获取信息。如今,有了“凤凰”大模型,只需轻松提出问题,“凤凰”将会深入研究,呈现准确的信息,为学术和生活提供便捷的指引。

“凤凰”不仅仅是一款应用,更是智慧校园导航。想知道学校有几个食堂?哪些菜品好吃实惠?向“凤凰”提问,它会一一解答,方便快速了解校园的方方面面。

据介绍,“凤凰”在具有香港中文大学(深圳)校内知识的同时,在通用能力方面也达到了GPT的95%的水平,具有强大的智慧内核。通过此技术,团队希望模型的输出更加贴近校园现实,为校内师生提供真正有用的智能化建议与支持。

在使用期间,“凤凰”研发团队深知数据安全与隐私保护的重要性。所有“凤凰”大语言模型的应用都遵循严格的数据隐私保护原则,确保师生的个人信息与学术数据。

目前,香港中文大学(深圳)研发团队除了开发了“凤凰”,还同时开发了专注于医疗健康领域的大模型“华佗GPT”。公开资料显示,2023年2月,研发团队发布的“华佗GPT”是首个国内类ChatGPT的医疗大模型,也是国内公开的首个通过多个医疗资格考试的大模型,目前线上已经有十几万用户体验了“华佗GPT”的功能。

采写:南都记者 伍曼娜 通讯员 马明霞

标签:

8月中旬拟发内测版!港中大(深圳)“凤凰”大语言模型来啦

来源:南方都市报 2023-08-13 17:47:45

博德之门3夺心魔寄生虫标本获取方法

来源:游戏资讯网 2023-08-13 17:24:23

乌尔赖希:我已经在拜仁证明了自己的能力,我能够替代诺伊尔

来源:直播吧 2023-08-13 16:51:28

百亿私募现身25家A股公司前十大流通股东名单

来源:潘益兵 2023-08-13 16:41:30

每日c葡萄汁 每日c

来源:城市网 2023-08-13 16:17:13

小米:PC 级 WPS 可适配小米平板 6 / Pro,将在安卓下一个版本落地,超大杯明日发布

来源:哔哩哔哩 2023-08-13 15:54:03

国防科技大学迎接学生 国防科技大学车站霸气接新生 基本情况讲解

来源:互联网 2023-08-13 16:02:18

8月13日:生猪价格大跌7~8毛钱,压价策略难奏效,二次育肥成关键

来源:老姜说农业 2023-08-13 15:01:58

雷军秀悬停拍照!小米MIX Fold 3真机首曝:皮纹玻璃你打几分?

来源:驱动之家 2023-08-13 13:53:46

男子在点播影院性侵未成年女孩 到底是这么回事?

来源:深港在线综合 2023-08-13 12:45:24

中美无人机发动机差距

来源:熊猫儿 2023-08-13 11:49:52

吕梁:抽丝剥茧重现“犯罪现场”!这场刑事技术技能巅峰对决圆满收官

来源:黄河新闻网 2023-08-13 10:42:39

巡查中暑高风险场所 劳工处发逾530警告

来源:中评网 2023-08-13 09:53:04

绿萝吸甲醛效果好不好 绿萝吸甲醛效果好

来源:互联网 2023-08-13 09:03:39

创新驱动县域发展丨西部小城积蓄科创优势

来源:经济日报 2023-08-13 08:06:39

沈阳市市场监管局与沈阳市消协发起倡议

来源:沈阳网 2023-08-13 07:04:36

宁波市奉化区司法局(关于宁波市奉化区司法局简述)

来源:互联网 2023-08-13 05:00:56

咋回事?凌晨的昆明长水机场,竟然堵堵堵飞机了…

来源:昆明日报-掌上春城 2023-08-13 01:48:37

山东养老金计发基数2023是多少?山东2023退休养老金上涨补发计算方法

来源:律法网 2023-08-12 23:01:15

国家金融监管总局:全力做好防汛救灾保险赔付工作 加大预赔力度

来源:中国新闻网 2023-08-12 20:57:10

(女足世界杯)日本女足缘何亚洲独秀?

来源:中国新闻网 2023-08-12 19:50:41

湖北警方发布电诈大数据分析:年轻群体最易受骗

来源:中国新闻网 2023-08-12 18:44:13

2万亿央企,紧急公告!

来源:中国基金报 2023-08-12 17:39:44

部署重点地区防汛防台风工作

来源:央视网 2023-08-12 16:48:40

蒙古:北线丝路的(关于蒙古:北线丝路的简述)

来源:互联网 2023-08-12 15:04:07

中环外圈发生三车事故 所幸无人伤亡

来源:新民晚报 2023-08-12 13:55:44

我的世界盖亚召唤冷却怎么调 我的世界盖亚怎么召唤

来源:互联网 2023-08-12 12:38:51

消防员抬水枪半跪推进与烈火对波

来源:中工网 2023-08-12 11:32:40

科维亚斯基金会领导针对学者和校友的政府重点合作

来源:互联网 2023-08-12 11:01:51

学费政府补 湖南鼓励医学高校毕业生当村医

来源:中新网 2023-08-12 09:58:35

Copyright   2015-2022 热讯知识产权网 版权所有  备案号:豫ICP备20005723号-6   联系邮箱:29 59 11 57 8@qq.com