专题│学术出版数据化决策创新研究:全流程、场景化与智能驱动
发布时间:1/4/2019 9:18:30 AM 浏览次数:1272
分享到:


  摘 要  大数据时代已然来临,学术出版可以依赖数据实现决策效率提升,避免将决定建立在偶然性冒险或直觉判断的基础上,从而大幅改进运营的精细化程度。从海关出版社、知识产权出版社、地质出版社、爱思唯尔、斯普林格·自然集团等机构的案例入手,探讨数据化决策在学术出版中的应用规律,归纳并论证全流程、场景化和智能驱动三大进路,分析数据化决策实施的边界条件和注意问题。
  关键词 大数据;数据化决策;全流程;场景化;人工智能
  在大数据时代,学术出版企业可以利用海量数据提高决策效率,为学术出版的综合提效提供支持。从需求侧分析,在学术文献阅读消费方面,量化自我(Quantified Self,简称QS)的现象越来越常见,即用户希望记录、分析和管控自己的阅读过程,希望与同行进行交流,希望获得有参考价值的知识图谱,从而为科研工作带来可测度的积极效果。[1]这种需求的演变要求学术出版企业利用海量数据优化决策效率,为用户提供更加定制化的知识服务。

1 数据化决策:学术出版转型升级的新引擎

  在诺贝尔奖经济学奖获得者的赫伯特·亚历山大·西蒙(Herbert Alexander Simon)看来,管理的本质就是决策。决策是管理活动的核心,管理的各项职能都围绕决策展开,无论计划、组织还是人事、激励和控制,决策贯穿管理活动的始终,管理者最重要的职责就是依据具体情境进行问题求解。[2]在学术出版过程中,数据化决策同样非常必要,简析如下。
  首先,数据化决策是学术出版物生产和分发效率提升的内在要求。众所周知,学术出版活动更加重视产品的严肃性、权威性和严谨性,数据化决策可以帮助经营者细化管理过程,比如设置指标评估任务执行效果,对风险进行辨识、监测和预警,通过数据记录控制生产程序以保证学术出版物的品质。在内容分发方面,用户反馈以及其他渠道采集的数据经过挖掘,可以辅助出版企业根据用户画像开展精准分发,同时还可以为用户提供个性化增值服务和特殊体验。例如,通过分析反馈数据决定是否在学术文献中引入沉浸式媒体以及虚拟技术和文字图表的配比关系。
  其次,数据化决策是学术出版企业内部管理绩效优化的保证。出版企业内部管理包括策划、组稿、编校、销售、服务、后勤支持等,这些活动全部涉及决策,都可以借助数据的采集、共享、分析、建模和测算来提升效率。例如,协同过滤算法可以帮助编辑筛选更受读者欢迎的选题,提高产品被接受和认可的概率。再如,销售过程中形成的交互数据可以帮助出版人进行复盘,检视销售实绩与营销计划之间的差距并剖析成因,进而改进市场推广方案。此外,绩效指标、营销效果和投资回报的精确计算可以帮助学术出版企业调整业务组合,提高市场份额和竞争优势。总之,数据化决策可以避免单纯依靠经验和直觉带来的偏差,为学术出版企业内部管理的精益化提供有力支持。
  再者,数据化决策是学术出版企业寻找外部协作、构建新的价值创造系统的内在要求。如果将学术出版放在科学信息交流的大格局下观照,出版企业要吸引并留住用户,必须突破原来的生产分发模式,重构知识服务链,通过协作来提高用户的价值和体验。从外部协作趋势看,学术知识的深层加工、深度搜索技术、可视化交互功能等业务将由不同企业负责,出版企业将在一个与外部完全链接的平台上开展价值创造,要想实现多种资源和能力的集成,为用户提供一体化综合服务,就必须在价值链管理方面有所突破,由分布式的价值创造变成多主体协同的价值网创新。例如,海关出版社的“海关研库”就立足自有版权,通过购买或合作的方式,搜集多个渠道的外部资源,秉承数字人文和个性营销的理念,借助多种工具和服务方式,辅助用户使用数据库,例如数值类资源的查询、批量下载和可视化展示,专业术语释义,优化检索功能等,[3]这些特色服务都是通过合作实现的。此外,联盟伙伴的选择,合作方案有效性和风险的评估,对联盟伙伴期望值的管理也需要数据化决策作为支撑。
  最后,数据的采集、清洗、存储、交换、共享和广泛应用,改变了行业的作业标准,学术出版领域通过数据优化经营效率成为未来竞争制胜的标配。在学术出版领域,数据赋能决策在内容聚合优化、人机协同编校、精准营销、客户关系维护等方面都将发挥重要作用。例如,在内容聚合优化方面,随着数据规模的提升、计算方法和计算能力的成熟,出版企业可以根据历史数据的挖掘,根据销售数据和点阅率等分析畅销产品的主题结构、信息组织特点,发现规律、联系,以此来提高后续工作的效率。例如,网智天元建设的出版大数据支撑平台和出版大数据知识资源库,重点提供数据咨询、传播营销和舆情管控三类服务[4],这样不仅丰富了产品类型和经营范围,而且从战略维度对现有资源进行转化加工,形成了具有新的深度、广度和形式的服务模式。
  总之,无论是阅读需求洞察、产品质量管控、人机协作效率提升,还是价值链优化和产业转型升级,数据化决策都能在学术出版领域发挥战略引擎的作用。作为新型生产因素,数据已经成为行业的关键驱动因素和企业成功的关键因素,基于强大数据分析力的商业决策逻辑,可以帮助经营者重构业务流程,完善内外部管理,也能给科研工作者提供更好的知识服务。

2 构建数据化决策能力的三大进路:全流程、场景化与智能驱动

  2.1 基于全流程的数据化决策能力的构建
  首先,数据化决策能力构建需要对业务流程进行系统的规划、开发和部署。业务流程一般包括参与者、活动、次序、输入、输出、标准化等要素。业务流程的设计或再造必须设法降低业务之间的耦合度,使局部业务流程的改动不会给全局带来灾难性后果,同时要通过数据分析简化协作难度,降低整体成本。在数字化、智能化、平台化背景下,学术出版企业应该制定严谨的流程管理制度,不同环节的分工必须经过严密的调查论证,不同任务的执行者(包括智能助理)要详细记录工作中产生的各类数据,然后比对设定的指标,发现问题及时解决,唯此方能兼顾业务流程的科学性和灵活性。例如,中教汇据科技有限公司历时三年打造的“中国终身教育学术研究数据库”于2018年7月16日上线运行,该平台实现了智能主编、稿件库、自动过滤、自动分栏、在线编审、自动排版、在线校对、印刷协作、国际发行等功能,对出版业务进行了全流程改造,通过数据应用让每个环节变得更加高效。[5]
  其次,数据化决策能力的构建有赖于业务流程管理的优化。数据自动处理、量化分析在学术出版流程管理中将起到至关重要的作用。例如,学术文献质量控制需要实时数据的监控,如果只是事后管理,那么很多数字文献的质量就会受到影响,严重的话还会损害品牌声誉。再如,在新技术环境下,传统的按部门进行职能管理的方式变得不合时宜,经营者应该按照工作流(work flow)来缩短数据交互时间,提高对用户诉求响应的速度。在学术出版企业内部,数据要建立集中管理制度,避免信息孤岛带来的负面效应。只有数据的集中管理、量化分析、动态交互才能带来决策效率的大幅提升,进而为流程管理带来质的跃迁。
  再者,根据学术出版流程的特征和规律建立计算模型,完善数据化决策的运行基础。数据化决策的核心逻辑是业务理解、数据处理、数据分析和数据呈现。海量数据的处理在计算能力大幅提升的前提下变得不再困难,数据化决策的关键是分析思路的设计和计算模型的构建。从系统论角度分析,我们可以把整个学术出版视为一个“目的性系统”,该系统可以细分为若干个子系统,每个子系统的优化都可以借助数据化决策。具体而言,就是要通过建立计算模型来表征业务环节之间的因果关系和逻辑关联,用数学语言描述问题,借助数学工具提供最优解决路径。计算模型的建立和修正需要大量经验的总结,笔者认为可以借鉴海尔公司“人单合一”的模式,即建立开放的面向用户的平台组织,一切以需求为转移,平台提供资源和机会,让用户参与前沿设计,从而实现共赢共享的目标。[6]学术出版企业也可以针对科研用户的诉求,赋予不同项目团队以权力和资源,鼓励他们通过合作提高创新效率,在实践中不断根据反馈修正模型,并结合特定的订单来加以执行。
  最后,结合出版项目或阶段性成果,验证数据化决策体系的实用性和可靠性,进而结合业务情境加以修正完善。数据化决策体系是否有效,除了计算模型外,还与执行力、员工态度、利益相关方的合作意愿有关,此外还应注意数据的背景,不能草率代入公式,忽略了因果关系和模型成立的前提。在经营实践中,对数据化决策体系应该建立评价体系定期考核,对于成功经验要在不同项目中推广,有问题的地方则尽快修正。评价指标的设置要重点突出数据化决策对业务流程优化的贡献率、对价值创造系统的支持、对客户满意度的作用、对财务业绩的意义以及对企业创新进步的影响等。
  2.2 基于场景化的数据化决策能力的运用
  数据的海量性、多样性和快变性,要求出版企业必须快速分析并响应数据,在与用户、战略伙伴的互动中,借助算法工具,满足不同场景下用户的新兴需求。数据中总含有模式,但所有模式都因为场景的变化而变化,因此,只有结合具体的生产和消费场景,才能发挥数据化决策的积极作用。
  首先,细分场景,匹配特定的用户人群和业务类型。在数字环境下,人类的阅读消费不仅看重内容的价值,还与读者的日常行为逻辑相关,用户场景各有不同,比如在地铁上、学术会议期间、教学科研时段、休闲时刻,用户希望能随时随地取得链接,以自己喜欢的方式展开阅读,学术出版企业要能以场景为导向提供个性服务。例如,在正式科研场合,数据库的检索功能完备就能满足用户的需求,但在某些特殊场合,语音问答、智能推荐学者和相关文献才是用户的痛点所在。再如,在移动设备上阅读时,用户希望有进度记录、笔记功能或能自动生成知识导图;在学术会议期间,如果出版商能为同行社交提供帮助,能为知识交叉与整合提供趋势分析,则会留住更多用户。不同场景下用户会有不同诉求,学术出版企业必须根据反馈数据来决定如何提供沉浸式服务,从社交化、本地化、移动化三个维度着手,对准不同时空情境下的特殊需求,重塑业务组合的重心。
  其次,找准切入点,巧妙介入价值创造的具体场景。随着技术革新和产业融合的深入,传统产业边界被打破,学术出版企业之间的竞争,逐渐演变为不同价值链之间的博弈。从技术创新管理的角度分析,用户不断增长的刚需与某个新技术的扩张期相遇,这种结合会产生一类产品和一种新的商业模式,这些产品和商业模式聚合起来就会形成新的价值创造系统。对学术出版而言,如何发现新的成长机会,关键在于经过大量数据分析,找准创新切入点,进而寻找合作伙伴,重构价值创造系统,满足新兴需求。
  例如,爱思唯尔研发的高性能计算集群系统(HPCC,High Performance Computing Cluster)可以高效分析结构化和非结构化的数据,爱思唯尔利用该系统为客户提供问题解决方案,取得了良好效果。场景一:佛罗里达州儿童、家庭部推出若干纾解民生困难的项目,包括食物救助和低收入家庭扶持,超过93%的申请者通过电子渠道提交申请,申请者的身份识别带来巨大压力和审核漏洞。考虑到当地老龄人口比例高、短期居住人口多,因此传统的利用银行账户识别身份的方案毫无用武之地。2013年,佛罗里达州政府选择了爱思唯尔的LexisNexis风险解决方案。申请者进入综合资格审查系统申请福利补贴后,需要回答一系列本人才能作答的问题,政府人员通过由HPCC系统支持的身份管理系统快速准确识别申请者资质。采用该技术不过五个月,佛罗里达州政府便凭借预防欺诈和提高效率节省财政支出1 500万美元,并获得了州长节约奖。采用这项技术以来,一共节省财政支出8.4亿美元,投资回报率为1∶194。场景二与此相似,伊利诺伊州库克郡借助LexisNexis风险解决方案堵塞税收漏洞,提高财政收入,四年内帮助当地增加财政收入4 700万美元。以上案例说明,爱思唯尔已经成长为面向全球用户的跨行业信息服务提供商,它有能力根据客户的问题提供针对性的解决方案,[7]这种创新来自数据化决策体系的成功运转,也给同类企业开展业务延伸提供了成功示范。
  最后,区分用户,借力活跃买家和意见领袖引爆市场热点。学术出版企业的客户关系管理系统会收集用户数据和交互数据(反馈、点赞、评论等),部分销售平台(如亚马逊)也积累了大量个人和集体购买习惯的统计数据,贝索斯就声称亚马逊拥有两亿活跃买家的详细信息,这些数据可以帮助出版企业发现活跃买家和意见领袖,这些人在文献的学术价值评估、引领阅读风潮、激发更多人关注、发掘独家卖点等方面具有非凡的能量,出版企业可以针对性地推送新增文献给这类用户,或者通过其他方式激发其表达欲、分享欲,借助其学术影响、职业声望、联络能力和说服能力进行促销推广。活跃买家和意见领袖可以在适当环境下充当联络员、行家和推销员的角色,甚至可以参与产品设计,为某类产品的流行起到催化作用。例如,海尔集团曾根据用户的一句网上评论—“为什么我们不能像古人那样在流动的溪水里洗衣服”,通过全球创新开放平台征集创意实施方案,最后通过跟陶氏化学以共享专利池的方式实现合作,在洗衣机里加入净水设备,满足了用户洗衣过程中90%的时间是在清水里洗衣服的需求,[8]在这个案例中,留言的网友就是典型的活跃用户。此外,学术出版企业还应贯彻“拥护性营销”理念,将内部员工和联盟伙伴都变成品牌的宣传员。
2.3 基于智能驱动的数据化决策能力的升级
  学术出版企业到底该如何提高数据化决策能力?笔者认为,一方面要获取和沉淀更多数据;另一方面要提升算法处理数据。换言之,要在人工智能的驱动下优化数据化决策能力。
  首先,数据化决策能力的升级必须依靠算法工具。《人类简史》的作者尤瓦尔·赫拉利认为:“未来的上帝将不再是客户,他们将不再是经济链的顶端,经济链的顶端是算法,算法将会帮我们做出越来越重要的决定,帮我们分析和解码客户的需求。”好的算法可以“点数成金”,没有好的算法,数据只是塞满硬盘的无用之物。[9]在学术出版领域,算法工具可以帮助编辑筛选稿件,修改和校对低级错误,如语法、标点、错别字等,让编辑能去从事更高级的创意策划、情感沟通等工作。海量数据在算法工具的支持下,可以打开决策的“黑箱”,让更多知识性员工参与进来,提高决策的透明性和准确率。
  其次,基于AI驱动的数据化决策能力升级应该结合营销实践逐步推进。人工智能辅助下的数据化决策能力可以帮助经营者提高需求预测、战略定位、差异化定价、内容分发、社群沟通、定制服务的精确度,还可以调整算法、数据和参数以减少认知偏差,降低经营风险。此外,智能驱动的数据化决策还可以让经营者跳出现有产品的局限,对环境的变化做出回应,及时地把握新兴机遇。例如,地质出版社以大数据技术领衔科普活动,运用大数据、云计算、知识标引、物联网等技术,加强用户数据、内容数据和交互数据建设,提高数据采集、存储、管理、分析和运用能力,借助海量数据资源为青少年、农民工、基层矿山、地质调查队提供精准的科普服务。[10]此外,地质出版社还构建了行业级大数据平台,包括基于移动互联网的地质教育服务平台、国土地质专业领域行业级数字内容运营平台、中国地质专业资源知识服务大数据平台、动漫IP创意与运维平台、不动产登记大数据平台。[11]这些举措都拓宽了企业的市场疆域和价值源头,是商业数据分析支持下的多元化战略成功实施的典范。
  最后,数据化决策能力升级需要借力于人工智能技术的进步。AI技术的演进类似于生物进化,是在与环境互动中逐步完成的。对企业而言,应用才是连接人工智能与用户的唯一锁钥。学术出版企业应该不断关注技术迭代更替的成果,提高人机协同效率,动态优化编审校发的流程。例如,学术出版商泰勒—弗朗西斯就与AI创业公司合作,旨在基于在线用户已读的内容向他们推荐其他内容。在引入AI的过程中,泰勒—弗朗西斯的软件架构师尼古拉斯·杰西认为,最佳的方案是利用自然语言处理和机器学习,教授机器语义模型,让它理解信息,最终让公司生产的任何内容都能通过机器学习与知识网络建立语义联系。[12]

3 数据化决策体系实施过程中需注意的问题

  大数据和人工智能技术能缩短学术文献的出版周期,改进科学信息交流的效率,研究人员的合作会更加便捷多样,思想交锋的成果也可以通过合作网络来共享。科研工作者会从综合性、跨领域和跨媒体的网络中汲取灵感,寻找合作伙伴,接受同行批评。上述愿景的实现还有以下几个问题需要注意。
  3.1 思维变革
  “数海淘金”首要是调整认知和观念。为开发数据化决策的潜能,出版人的经验直觉必须与数据分析、算法工具有机结合。学术出版企业的高管和技术总监必须转换思维,预判创新趋势,积极与员工及合作方沟通,在发挥人的创造性的同时,主动迎接技术变化,信任数据和算法的力量,利用数据化决策提升运营效率,减少复杂快变的环境带来的不确定性。在实践中,如果数据分析得出的结论看似疯狂,违背常识和认知定势,这时就是考验决策者的智慧和格局的关键时刻,思维的突破变得不可或缺。
  3.2 项目导向
  数据化决策能力的提升是在项目应用中实现的,主要体现在各类精心设计的学术产品和营销方案上。例如,斯普林格·自然集团的科研小助手Sci Graph能为读者提供科学知识图谱[13];知识产权出版社的拳头产品专利数据库,为用户提供即时、权威、全面的专利数据资源以及信息咨询、专利布局、投融资参谋等服务;[14]Yewno公司通过对知识节点深度挖掘,寻找多个领域的关联,形成颗粒度更细的知识结构,基于对信息的摘要性理解以及知识的可视化,研发新的产品。[15]上述案例都是在项目实践中摸索成功的,既善用了技术赋能,也创新了知识服务的模式。
  3.3 数据真实
  数据是学术出版的命脉。然而,真实的数据才有价值,不准确或被篡改的脏数据会扭曲管理者的判断,影响战略规划和日常运营。在出版领域,越来越多的企业采用数据化决策体系,这些脏数据会给企业发展带来致命打击。学术出版企业可以通过配备一系列技能与工具进行数据清洗,并借助多维交叉验证等方法,来保证数据的真实性。通过引入专业的数据科学和网络安全能力,企业可以构建新的“数据智能”体系。数据越真实越健康,从中获得的洞见和决策就越可靠,同时还能察觉其他隐患。总之,确保数据真实可信是学术出版企业以数据为引擎获得发展新动力的关键。[16]
  3.4 组织调适
  战略管理大师艾尔弗雷德·D·钱德勒(Alfred D. Chandler)的“结构跟随战略”理论认为:战略重点决定组织结构,战略重点的转移决定组织结构的调整,组织结构制约战略重点的实施。在引入数据化决策体系后,学术出版企业应该对组织结构进行彻底改造,以适应精细管理和量化决策的需要,弥合战略与执行之间的差距。例如,从纵向层级看应该减少层级,从横向跨看部门之间必须要基于业务逻辑进行数据的打通和融合,解决沟通中的信息失真或滞后问题,特别是大型出版集团,组织架构庞大复杂,尤其要避免官僚作风和陈规陋习给数据共享带来的影响。

4 结  语

  数据化决策并不是万能的,学术出版企业除了发挥现有业务数据和用户数据在决策中的作用之外,还要注意资深出版人内隐知识的转化和分享。日本管理学家野中郁次郎认为,内隐知识是高度个人化的知识,通过“默会致知”习得,难以规范化,因此不易传递给他人;它深深植根于行为本身和个体所处环境,包括个体的思维模式、信仰观点和心智模式等。在内隐知识的认知基础上,野中郁次郎提出外显知识和内隐知识相互转换的SECI模型(即社会化、外化、综合化和内化)和知识螺旋,以实现内隐知识的传递。[17]换言之,高度个人化的内隐知识通过共享化、概念化和系统化,在组织内传播,才能被所有员工吸收和升华。在学术出版企业,资深出版人的经验、直觉、感情以及独特的心智模式经过长期积累形成的内隐知识(编辑思想、学识视野、实践智慧、技能诀窍和思维境界等),借助于制度化的交流共享可以实现内隐知识的外显化。因此,学术出版企业应该鼓励经验丰富的出版人与其他员工积极互动,通过展示、练习帮助他们完成自我学习、纠错和进化的过程。资深出版人内隐知识的外显化可以弥补现有数据的缺陷,帮助学术出版企业更好地把握战略重心和执行要点,为人类科研事业的进步贡献更多力量。
参考文献:
[1] 李东进,张宇东. 消费领域的量化自我:研究述评与展望[J]. 外国经济与管理,2018(1):3-17.
[2] 西蒙. 现代决策理论的基石[M]. 北京:北京经济学院出版社,1989:14-19.
[3] 王桦:在必谈“大数据”的时代,我们却开启了“小数据”应用模式[EB/OL].(2018-02-27)[2018-08-19].http://www.bookdao.com/article/405316/.
[4] 网智天元受邀出席融媒体创新发展论坛 应用大数据智能助力出版数字化[EB/OL].(2018-07-31)[2018-08-14]. http://biz.huanqiu.com/dt/201807/12614847.html.
[5] 智能出版平台“中教数据库”正式上线运行[EB/OL].(2018-07-17)[2018-08-28]. http://kc.china.com.cn/2018-07/17/content_40424141.htm.
[6] 井润田,赵宇楠,滕颖. 平台组织、机制设计与小微创业过程:基于海尔集团组织平台化转型的案例研究[J].管理学季刊,2016(4):38-71.
[7] relx2017-annual-report[EB/OL].(2018-02-14)[2018-09-04]. https://www.relx.com/~/media/Files/R/RELX-Group/documents/reports/annual-reports/relx2017-annual-report.pdf.
[8] 陈威如.4个案例告诉你平台该怎么玩[EB/OL].(2014-07-09)[2018-08-20]. http://www.360doc.com/content/14/0709/16/15477063_393212470.shtml.
[9] 尤瓦尔·赫拉利. 人类简史:从动物到上帝(新版)[M]. 林俊宏,译. 北京:中信出版社,2014:14-41.
[10] 地质出版社作为主办单位之一参加2016年地学科普高峰论坛[EB/OL].(2016-11-22)[2018-08-28]. http://www.gph.com.cn/cbsxw/641.jhtml.
[11] 政府采购信息网符合地质出版社的查询结果[EB/OL].(2018-08-11)[2018-08-21]. http://www.
caigou2003.com/e/search/result/?searchid=73616.
[12] 人工智能在学术出版上可以有哪些应用,泰勒·弗朗西斯正在尝试[EB/OL].(2018-05-17)[2018-08-21].http://www.bookdao.com/article/406953/.
[13] 宋宁远. 面向智慧数据的科学知识图谱构建:以SciGraph为例[J]. 科技与出版,2017(11):17-19.
[14] 为什么说知识产权社是独一无二的出版社?[EB/OL].(2016-10-24)[2018-08-19]. http://chuansong.me/n/1014178751757, 2016-10-24.
[15] 孙赫男. 人工智能技术与学术和专业出版的融合发展[J]. 出版广角,2018(7):34-36.
[16] 埃森哲埃森哲技术展望2018[EB/OL].(2016-04-27)[2018-08 19].http://www.dx2025.com/newsinfo/187698.html.
[17] 芮明杰,李鑫,任红波. 高技术企业知识创新模式研究:对野中郁次郎知识创造模型的修正与扩展[J]. 外国经济与管理,2004,26(5):8-12.
来源:https://mp.weixin.qq.com/s/F15OdIC47kjG1PxtU0fqaA

声明:本网站为非盈利网站,大多信息来源于网友推荐。如果作者或其他版权所有人认为违反了您的权益,请告知我们,我们会在24小时内删除。