拓尔思:高质量数据是大模型价值跃迁的制胜法宝
2023-06-05 12:12:36    证券日报


(相关资料图)

2023年5月31日下午,人民日报社技术部主任何智敏、技术部副主任居晓军等领导一行到拓尔思(300229.SZ)总部调研,拓尔思总裁施水才携相关业务负责人接待陪同。

何智敏一行听取了拓尔思正在承建的人民日报“国传”融媒体及中央数据库项目建设情况,双方就当前热门的大模型技术如何赋能媒体生产和传播,提升媒体行业服务能力等话题做了深入交流,并研究了拓尔思与人民日报共创的人民专属大模型落地应用的有关问题。

调研最后,双方均表示在AIGC大模型时代下,探索媒体与大模型的融合应用势在必行,未来双方将依托各自在媒体领域的技术产品与生态优势,携手加强媒体大模型的深入应用,共同推动媒体融合向纵深发展。

目前,拓尔思已经积累了大量的专业模型、AI工程化经验和千亿级规模高质量数据资产,在中国NLP市场中占有重要地位。根据国内权威咨询机构赛迪顾问发布《2022-2023年中国NLP市场研究报告》显示,预计2023-2025年,中国NLP市场将保持33%以上增速;到2025年,NLP市场规模将超过400亿元。

自2022年11月份ChatGPT发布以来,国内大模型如雨后春笋般,层出不穷。据智东西统计,截至2023年5月29日,国内至少有55个类GPT大模型已经推出或马上面世。互联网/云服务大厂、AI企业、传统行业公司、大数据公司以及算法公司几乎全部入局。

在大模型“百花齐放”的背景下,民生证券在研报中指出,“单纯发布一个大模型的门槛没有市场想象中的那么高”,“有大模型不难,难的是有一个能持续迭代,性能不断提升的优质大模型”。一些观点也提到,高质量数据才是垂大模型发展的稀缺要素。

据拓尔思方面介绍,高质量数据是大模型价值跃迁的制胜法宝。目前,拓尔思拥有规模及质量均位列业界前茅的网络公开数据。千亿规模的高质量数据不仅可用于拓尔思自研的拓天大模型中,媒体、政务、金融三个领域的基础知识注入,也可为其他广大的MaaS服务商提供训练数据集服务。这些数据既可帮助垂类大模型实现中文特性增强,也可显著提升在上述专业领域方面的上下文和生成连续文本的能力。

(文章来源:证券日报)

关键词:

下一篇: 最后一页
上一篇: 美美哒删除不感兴趣的话题图文教程-今日观点

拓尔思:高质量数据是大模型价值跃迁的制胜法宝

美美哒删除不感兴趣的话题图文教程-今日观点

中汽协:4月我国汽车整车出口42.5万辆 同比增长1.5倍

6月5日吕梁天气早知道

科技之伞护佑航天员天外归来|全球焦点

音乐剧《剧院魅影》中文版的上演意味着什么? 环球观热点

总经理亲自上阵,毕业季公募开启“抢人”大战

百事通!黄金四周以来首次上涨,澳股周五续反弹0.48%,超市巨头Coles欠薪2500万澳元!

年年岁岁花相似岁岁年年人不同_年年岁岁花相似岁岁年年人不同是什么意思

【焦点热闻】韩氏仙路小说_韩氏

凡参与以下军事行动均可认定参战,享受应有待遇!

基金怎么看当天涨跌多少(基金怎么看当天涨跌)_环球看点

焦点消息!中国移动呼和浩特智算中心在和林格尔新区开工建设

焦点精选!过于豪华!进球网盘点自由球员阵容:梅西本泽马领衔,阿扎尔在列

今日要闻!微博贷款4千不还会影响征信吗

蒋文定当选九江市市长 当前热议

全球瞩目 拜登签了!“避免了一次经济危机和经济崩溃”

首都功能核心区传统地名保护名录新增500多处传统地名

中国星辰 | 210秒回顾航天英雄凯旋回家之路!

天天微动态丨设立护考小分队、开辟绿色通道……广州交警今年这样护航高考→

沈阳奥迪A4价格查询指南:车型、配置和优惠

海员达布隆币在哪换坐骑_海员达布隆币在哪换东西 世界播资讯

金花葵的价值-金花葵的花多少钱一斤 焦点滚动

动态焦点:消息称苹果正改造 watchOS 10,让应用适配Apple Watch Ultra

要闻:小学三年级运动会报道稿_小学三年级运动会通讯稿3篇

阳光照明(600261)6月2日主力资金净卖出68.25万元

全球热讯:今年超千场活动营造“学术北京”氛围

江苏省2021年成人高校招生录取工作什么时候开始?

全球快看点丨A股房地产板块午后继续活跃 中交地产现已涨停

下肢浮肿是怎回事_下肢浮肿的原因有哪些 独家焦点

要闻速递:“大美广元 邀您来宿” 广元民宿投资推介会在成都举行

天天热点!塞打螺丝国标百度文库_塞打螺丝规格尺寸表

筒灯间距最佳设计(筒灯间距) 环球速讯

丰田旗下的汽车品牌及价格(丰田旗下的汽车品牌)-最新快讯

超级台风玛娃路线向东北方移动 强度缓慢减弱

市场监管总局发布2023年民生领域反垄断执法专项行动典型案例(第一批)_世界速递