智慧媒体,数据先行——南方报业“中央数据库”建设的实践与探索

时间:2019-08-04 来源:www.288mj.com

媒体数据有哪些数据,特征和优势?媒体如何积累有价值的数据并深入挖掘并使用它?如何在媒体数据共享流通中提升数据资产的附加值?如何扩展媒体大数据的应用?南方报纸中心数据库不仅关注挖掘数据的价值,还关注实际的应用场景。智能媒体,数据优先南方报业中央数据库建设的实践与探索

何坤陈良孝

人工智能需要在媒体行业中积累。它需要数据积累和建立智能媒体。数据是最基本的资源。

南方报业集团数据库采用“螺旋闭环”数据服务模型和技术研发与机制创新的并行构建模式,探索媒体大数据的构建与应用。

1

项目建设路线图:从建立数据库,提供数据情报服务到建立媒体数据生态系统

在项目的第一年,中央数据库主要侧重于构建数据库数据。 V1.0构建的关键任务是中央数据库对每个部门的内容数据开放,并建立一个收集内容数据的中央存储库。围绕这一建设目标,基于南方报纸200多个原始数据源的所有媒体数据,建立了报纸图书馆,期刊图书馆,网站图书馆,APP图书馆,微信图书馆,微博图书馆,图片库和视频库。优秀的淘宝图书馆,历史线索图书馆,报纸数据库,文献数据库和人员报告数据库,地理报告数据库和基于实体提取技术的机构报告数据库,形成2326个数据库(套),包括该组的所有新旧媒体。数据,为用户提供跨数据库搜索,查看,下载,分析和其他服务。

同时,根据南方报业智库集群业务发展的迫切数据服务需求,引入外部专业知识数据服务;根据各智库的研究需要,对“党建数据库”等13个专业领域知识库进行个性化;智库研究人员为专家,案例研究,研究课题等提供标准化数据管理。此外,通过互联网政治经济数据的定向收集,形成了专业的大型“南方政治经济数据库”。

在第二年,数据情报服务是在不断积累数据的基础上提供的。近年来,随着本集团媒体服务单位在数据服务市场的不断发展,市场上各类用户对数据服务的需求越来越多样化。这些要求复杂多变,重叠和重叠,这使得高质量数据产品的生产,有价值数据的积累,数据挖掘和分析以及数据智能应用都需要快速响应和支持。在此基础上,该项目初步建立了“南方数据中心”,将数据和数据应用程序抽象封装到服务中,弥补了数据产品开发与服务应用程序之间由于开发速度不匹配而产生响应的缺点。每个业务部门更全面地共享技术平台和共享服务功能,以促进组内数据和应用程序的流通,减少前端服务的技术和数据重复。

此外,通过创建“南方数据门户”为群组用户提供数据资源和数据功能,用户可以使用Southern Digital的数据资源,数据工具,数据智能引擎和其他大数据和人工智能服务。目前,除了提供2340个数据资源外,南方数据门户还开始提供数据收集,机器编写,数据分析可视化,用户肖像,准确分布,传播分析,视点提取,VR/AR,人脸识别等。近80种数据智能工具服务从生产,通信和运营等方面支持南方报业的智能集成和创新。

此外,在深化数据积累方面,项目开始通过技术系统和机制的并行标准化南方报纸的所有写作过程数据,同时,通过数据封装访问形式,各种媒体的集合思考该集团的坦克。数据库,如广东商业环境数据库,企业声誉数据库,舆论数据库,大湾区数据库,国家会议和访谈数据库等,进一步整合到外部党政,知识,行业和其他类型的多维数据。南方数据中心将通过建立源数据通道来开放数据访问功能,以促进各种类型数据的流通和共享。

Southern Data Central和Southern Data Portal将为Southern Newspaper Industry的媒体数据服务生态系统提供平台级支持。用户对数据需求的多样化带来了数据服务的多样化,以及丰富的数据服务应用场景的出现。南方报纸的各种媒体和智库的数据业务发展已经盛开。在向用户提供数据服务的过程中,他们产生了各种类型的数据并积累了各种数据功能,从而产生了一批数据处理工具。这些应用场景和数据资源,数据智能工具,几乎已经开始朝着真实而丰富的大数据生态系统发展。

8861be526d304ea5a9b37252e445c2e5

2

项目建设方法:“并排建设+并排”,“闭环+螺旋”式数据服务,“技术+机制”建设并行

将用户需求聚合到库中以进行快速迭代优化。 “用户思考”是“中央数据库”项目系统建设的第一个思路。在项目开始之初,项目组对各方进行了深入研究,系统地整理了不同场景下个人用户和类似用户提出的要求,最后将其总结为中央数据库“用户需求数据库”。用于分析和挖掘。同时,组建了数据服务实验小组,对数据服务产品进行了针对行业优秀数据服务案例的测试,最终推出了“中央数据库”V1.0。之后,系统访问用户,倾听用户的意见和建议,快速响应用户的需求,并不断迭代和优化。

通过“闭环,螺旋”数据服务模式,与业务部门合作探索数据服务应用场景。该项目始终基于“用户需求数据库”。一方面,它提供围绕用户共同需求的数据服务,例如为该组的所有用户提供数据分析可视化工具,引入专业数据资源,构建组内容数据库等;用户的个性化需求,分析数据应用场景,提供个性化数据服务,并构建完整的数据服务闭环。同时,根据集团的整体发展需求,这些个性化数据服务以螺旋形式关闭,服务被打包形成整体服务能力。例如,它与南方经济智库合作,为互联网数据收集,专家图书馆和案例库系统的构建提供个性化服务。

探索数据共享机制的构建,以确保足够的数据驱动动能。中央数据库不仅是技术系统的构建,更重要的是,有价值的数据资源的整合,积累和流通是数据处理能力的提高。如何促进和鼓励群体内各媒体单位之间的数据和数据能力的共享和交换是项目建设的重点。形成良性循环是不可能的。在此基础上,为确保数据资源的顺利积累和流通,本集团澄清南方传媒学院是一家专业的数据资产管理机构,负责本集团的内部数据收集和管理。集团技术委员会领导中央数据库项目组和南方传媒学院共同开发《南方报业传媒集团数据管理办法》《南方报业传媒集团新闻采写过程数据采集管理办法》。未来,他们还将制定数据资产识别和交易管理措施,确保南方报业数据服务能力建设走上良好的发展道路。

48b763eb1ad84b62a24f2a00e4ad1ab1

3

如何深入挖掘媒体数据的价值?

下半年媒体整合的重点将是智能化的。从媒体到数据,从通信到服务,从访谈到收集,从内到外,动能转换的过程需要改变思想,转换机制和转换形式。通过使用数据,提升数据,收集数据和管理数据,数据中的数据。从操作到操作数据服务,形成了用于媒体数据生成应用的新的闭环系统。

媒体数据不能限于当前媒体数据,而应基于由媒体连接能力,地理优势和服务定位特征形成的各种类型的数据。媒体的数据库建设不能停留在简单媒体库的时代。振兴媒体数据的使用需要新思维。加快数字经济时代媒体整合与创新的发展。考虑到“数据资产增值”和市场需求,我们将针对不同的用户需求和市场需求创建切实有效的解决方案。媒体数据产品和数据服务。

注重数据流通的实现,探索媒体数据的经济价值。为了建立有价值的数据库,一方面是数据积累,更重要的是,实现了数据,实现了媒体数据资产的增值。无论是传统媒体还是新媒体,都应该在原有的商业盈利模式的基础上把握数字经济发展的机遇,开辟媒体数据服务的能力,开辟新的利润渠道。

首先,要抓住时代的需要,充分发挥媒体的优势,建立多元化,独具特色的专业数据库,创造适合党政机关和企业需要的各类数据。其次,基于大数据价值分析挖掘,洞察数据背后的常规趋势,形成数据分析报告,并为用户提供决策参考。此外,媒体的连通性,影响力,可信度和通信能力可以充分利用,以提供大数据生态系统连接服务。相当于数据事务的中间服务。或者,在数据业务开发过程中,一些相对早期转型和相对先进的媒体构建了基于平台的数据技术产品,通过提供数据平台授权服务可以实现盈利。在过去两年中,南方报业传媒集团的数据服务业务发展迅速,在数据库,数据洞察和数据平台授权方面取得了良好的市场成果。

帮助政府实现精确治理,媒体数据具有重要的社会价值。一方面,媒体数据作为构建智能媒体的基础资源,为媒体的深度整合和发展提供了充足的营养,有助于媒体利用人工智能技术全面提高舆论引导能力。新闻采集,制作和发行过程。另一方面,记者记录每天发生的重要新闻信息,并记录这个时代产生的数据。这些数据是真实有效的,然后与其他媒体渠道相结合,如报纸,调查,互联网收集和合作连接。数据构成综合数据。通过对智库的智慧分析,对这些数据进行结构化处理和多维挖掘,可以为政府治理提供准确的决策参考服务,有助于提高政府治理能力。这是媒体数据最重要的价值,也是南方报纸建设中心数据库的第一个价值。

(何坤是南方报业传媒集团技术委员会成员兼信息技术部主任;陈良孝是该集团“中央数据库”项目组成员)