基金项目:陕西省出版科学基金项目(17BSC15)
作者简介:桂智刚(1970-),男,西安建筑科技大学学报编辑部副编审,硕士,研究方向为期刊编辑与出版; 吴海西(1976-),男,西安建筑科技大学学报编辑部编辑,博士,研究方向为期刊编辑与出版。E-mail:4998932@qq.com
(Editorial Department of Journal, Xi'an Univ. of Arch. & Tech., Xi'an 710055, China)
big data era; university academic journals; big data thinking; integration; challenges and changes
DOI: 10.15986/j.1008-7192.2020.04.014
大数据时代,高校学术期刊面临着众多的问题和挑战。在现有的条件下,应首先运用大数据思维,对选题策划、组稿审稿、编辑加工、出版发行甚至管理模式等各个环节进行优化与整合,并实现全程化的数字出版。当然,一切条件具备时,自建准大数据平台也是一种选择。在内部资源优化与整合的同时,应加强外部的合作与融合,探索刊-刊融合、刊-网融合、刊-网-馆融合等多元化的融合方式。另外,同现有的大数据拥有者进行数据购买或实行数据外包服务来获取大数据,也是一条切实可行的路径。最后,从国家、学校及期刊编辑部三个层面给出了一些建议。
In big data era, university academic journals are faced with various problems and challenges. In order to realize the digital publishing in whole process under the existing conditions, this paper proposes employing big data thinking to optimize and integrateall aspects of edictinglike selecting and planning topics, soliciting and examing contributions, editing and processing manuscripts, publicating and distributing jounals, and applying management mode.It is also an option toestablisha quasi-big data platformif all conditions are right. At the same time of internal resources of optimization and integration, we should strengthen the external cooperation and integration to explore the diversified methods of journal-journal integration, journal-network integration, and journal-network-library integration. In addition, it is also practical and feasible to purchase data with existing big data owners or implement data outsourcing services to obtain big data. Finally, some suggestions are given from three levels of state, university and editorial department.
2009年,全球最大销量的通俗杂志美《读者文摘》申请破产……
2013年,美国《新闻周刊》开始停出纸质版,只出“数字版”……
2014年,“京东”进军出版业,出版第一本图书——《大卫 贝克汉姆》……
不断地破产,不断地停刊,不断地进军出版业。一时间,硝烟弥漫,危机四伏——“狼来了”!
现在,出版业面临着巨大的冲击——市场化、全球化、数字化、网络化、数据化。对于学术期刊,网络化、数字化、数据化,首当其冲且最为紧迫。网络化就是“上网”,能被搜索引擎搜索到,即“一网打尽”。而信息首先必须通过“加工和制作”→“数字化”,然后再经过“分析和整理”→“数据化”,才能真正发挥其价值。
大数据,一般公认其具有“4V” ——海量(Volume)、多样(Variety)、快速(Velocity)、微值(Value)的特性。简单地说,就是在“海量”“多样”的动态数据中,“快速”深度挖掘其“微值”的技术。“海量”,达到TB或PB级(106TB); “多样”,有大量的非结构数据(如社交网络、搜索引擎、音视频等数据); “微值”,对整体高价值来说其价值密度极低,也许在长期的视频监控中,仅有一两秒有用的数据。这些都不是现有常规软件可以分析和处理的。现在我们举几个小例子,见证一下神奇的大数据。
“比你还了解你自己”。2012年,Target公司通过大数据分析,比一名高中女生的父亲更早知道她怀孕[1]。
“相关关系很重要”——啤酒+尿布[2]:沃尔玛根据购物小票发现,每周五的啤酒和尿布销售量都很高。原来年轻的爸爸下班后常帮孩子买尿布,顺便带点啤酒,晚上看球喝。遂把啤酒和尿布摆在一个货架上,销售量双双增长。
“算”出来的电视剧——《纸牌屋》[3]。美国Netflix在筹拍《纸牌屋》的时候,通过大数据分析“用户喜欢哪个导演,喜欢哪个演员,偏好什么内容”,把三者结合起来,一炮而红。
“10年后的精准营销”[4]。现在假如你买了一本《怎样做一个好爸爸》,那么“当当”半年以后就会向你推荐婴幼儿用品,两年之后再向你推荐儿童玩具……精准营销至少可以追踪你10年。
大数据时代的“杂志”——《今日头条》。《今日头条》通过大数据与算法的结合,对海量数据的深度挖掘,为读者提供个性化的阅读服务,已成为成长最快的自媒体。
2015年9月,国务院印发《促进大数据发展行动纲要》。2015年7月9日,首个国家大数据中心落户贵州[5]。2015年10月,党的十八届五中全会正式提出“实施国家大数据战略,推进数据资源开放共享”[6],这表明我国已将“大数据”上升为国家战略,而且它还涉及到国家安全问题,有“数据主权”的说法。
截至2016年我国共有期刊10 084种[7],其中学术期刊共6 430种[8],高校学术期刊超过2 000种,约占我国期刊总数的1/4,占全国学术期刊总数的1/3。学术期刊最大的特点是学术性及公益性,更注重社会效益,未市场化运作。而非学术期刊己商业化运作,如《女友》《读者》等,自主经营、自负盈亏。
纸媒的优势:适宜阅读; 出版较严格; 长期累积的资源; 论文评定的认可,因此其仍保持着权威地位。新媒体的优势:表现多样化; 易于存储; 成本低; 传播快; 周期短。对比可以发现,他们既是竞争关系,更是互补关系,因此新旧媒体融合势在必行。在思维上,新媒体更意识到分享比搜索更重要,互动比传播更重要。
出版业的命运取决于读者,但读者的阅读习惯已发生很大的改变,纸质阅读→电脑阅读→移动阅读。人们以“悦读”为新的阅读习惯,并呈现出碎片化、浅表化、娱乐化等特征。可视化的“读图”开始盛行,现已进入视、听、触的全感官的新阅读时代。人们阅读的是文章或片段,甚至是碎片化的“知识点”。信息超载决定了读者只会选择喜好的内容,这决定了内容推荐和定制化时代的到来。学术期刊具有科学性、前瞻性、严肃性等的学术特征,怎样将其深奥的科学知识“轻松”传播出去是摆在编辑面前的一个难题。
在大数据时代,读者数据显得极为重要,对海量的读者数据进行分析,从而有效把握读者需求,可以达到选题的精准策划和内容的精准推送。而用户数据的争夺大战,也在不断地上演,如2017年华为和腾讯的用户数据争夺事件[9],更说明了大数据时代用户数据的重要性。
总体来说,高校学术期刊普遍存在着“小、散、弱”等不足。“千刊一面”“低水平重复”等批评声不绝于耳,甚至被称为“学术垃圾”的加工厂。据调查[10],高校学术期刊大多属于综合性办刊,经费来源于学校的拨款,编辑要负责好几个学科,40%的版面预留给本校,且很少主动约稿。目前其数字化出版主要表现为:加入中国知网等数据库,自建网站,实现了“两微一端”(微博、微信及移动客户端),运用了采编系统,但大都没有实现编辑出版流程的全程数字化。数据的分析利用不足,造成了有数据无资产,在信息更新、交流互动等方面也存在着明显欠缺。
(1)期刊准入法人制度——减弱了学术性。期刊准入的门槛高,又没有退出机制,再加上高校学术期刊的依附性和边缘化,极大地制约了刊物的活力。而单位法人制度使学术期刊与学术团体割裂,综合性刊物尤其更偏向于单位的行政性而非学术性。
(2)期刊评价分级制度——评价不够全面。现在以量化指标为标准的期刊分级制度,最为诟病的是“以刊评文”及其与评奖评优、职称评定、学位晋升和课题申报等“挂钩”的现象。此外,大量新媒体与自媒体中的学术评价,也并未纳入到的评价指标中,学术评价明显不够全面。
(3)出版与发行分离——见文而不见刊。CNKI等数据库造成了出版与发行的彻底分离,“见文不见刊”使期刊和栏目进一步的弱化。
(1)领导重视不够。编辑部在高校中大多属于教辅单位,地位日趋边缘化,领导不够重视,编辑人员的工资、待遇低下。
(2)办刊模式僵硬。“坚持学术与服务本校”“办出特色与兼顾全面”,成为了两大难题。办刊宗旨应是“学术性”,但现已套上了“内向性”的“枷锁”,专业面大而全,且着重照顾校内稿件。编辑部自主权不多,缺乏内在驱动力。另外,纸刊仍然是量化评价、职称评审的依据,期刊缺乏“生存压力”。
(3)选题约稿不够。发表论文仍是刚性需求,且稿源充足,所以选题工作不受编辑部的重视,更较少进行约稿。
(4)审稿方式单一。双向匿名审稿,仍有将不同观点打入冷宫的风险。稿件多来自本校,“近亲繁殖”,同质化现象比较严重。
(5)编辑加工繁琐。内容精深难懂,加工重复繁琐,并且无法实现“一次排版,多元出版”的新模式。
(6)出版发行落后。出版周期太长,未及发表就已“过期”; 原封不动的全文“搬”上网,网页、微博及微信也仅是“翻版”,多处于“僵尸”状态; 纸刊只能发表文字和图表,图表的大小和分辨率也受限制。读者在知网上下载论文,需付高昂的费用,限制了学术期刊的传播。
(7)营销服务欠缺。“出刊即结束” 的观念,使期刊缺乏读者跟进和跨媒体营销,与读者几乎是零交流。
(8)编辑人员短缺。人员不足,束缚了高校学术期刊的发展:第一,综合性的定位导致了编辑人手的短缺。编辑分身乏术,仅能维持工作,更无暇顾及数据平台。第二,编辑人员的专业化程度较低。一个人是负责几个学科的“杂家”,就很难保证其专业化水平。第三,编辑是教辅人员,地位、待遇低下,难以吸引高学历的年轻人加入。第四,尚未建立与时俱进的人才培养机制。人员的构成往往是“重内容、轻技术、无经营”,缺乏既懂“技术”,又懂“出版”的人才。第五,期刊准入“严进难出”的体制,形成了外在的保护,编辑缺乏竞争意识,不思进取,往往表现为“等稿”。
(9)现有采编系统的困境。现有采编系统的不足:① 采编系统间相互独立,数据无法统一。未来如果结成期刊联盟,将无法互联互通。② 数据库的架构多采用集中式,其与大数据的分布式架构完全不同,无法应对海量、庞杂、快速的大数据冲击。
(10)评价方式片面。现在的“以刊评文”,与大数据“见文不见刊”的趋势相悖,其造成了期刊“强者愈强、弱者愈弱”的马太效应。而个别期刊通过操纵影响因子进入核心期刊,更是人为制造了不公。
(11)版权问题凸显。学术期刊数字出版的每一个环节都存在着被侵害版权的风险,且维权成本极高。
(12)行业标准不统一。至今,期刊数据库间并没有统一的技术标准,数据的转换,严重影响了读者的阅读效率。
(13)大数据应用难度大。首先,搜集的难度大。内部没有完成全程的数字化,外部又不会轻易转让数据。其次,拥有的难度大。大数据的门槛高,是典型的“三高”产业(高技术、高投入、高风险)。由于地位被边缘化,人、财、物也很难到位,与大数据的对接有了难以逾越的鸿沟。
“有什么样的学校,就有什么样的期刊。”领导重视是办好期刊的首要条件,况且高校的“双一流”建设,也离不开学术期刊这个科技交流的宣传阵地,应把它办成学校工作中的亮点和名片。没有学校领导的重视,提高办刊质量也就成为一句空话。
应继续坚持“学术性”的办刊宗旨,使学术期刊成为“海纳百川、兼容并蓄”的学术思想交汇之地。
在现有采编系统进一步优化的基础上,运用大数据思维,借用CNKI等数据库中的“大数据”,并将“两微一端”等新媒体的数据作为补充,可以完成大数据的引入和应用(图1)。在前期的选题策划中去捕捉、筛选信息,在中期的组稿审稿中去评估、优化信息,在后期的出版发行中去推送、传播信息。大数据思维就是——用数据说话,用数据决策,用数据管理,最终实现用数据创新。
(1)积极获取信息。学术期刊网站记录了大量投稿作者的相关数据,而大数据正是通过“加工”数据实现“增值”的。
(2)加强选题策划。大数据的核心是“预测”,即预测未来的发展趋势。很多人认为,只有图书才有选题,但在大数据时代,要办好一本学术期刊,细致的选题策划也必不可少。
目前,我们可以通过以下方式来把握选题方向:①根据CNKI的被引频次和下载频次,确定高被引论文的选题。②根据CNKI“大数据研究平台”的“学术趋势搜索”及“学术研究热点”,以及“国家级科研项目”“中国学术会议在线”“国家科技报告服务系统”等网站,来检索科研热点的主题、相关国家课题、研究人员和研究机构等主要信息。③利用文献计量软件,通过共词分析、共被引分析、耦合分析→聚类分析→研究热点。④考虑到CNKI等数据库都有一定的时滞,还需要通过网站、微博、微信的点击率、下载率等相关即时“热点”数据,来确保期刊选题具有先进性和前瞻性。
(3)优化约稿组稿。首先,根据选题策划的要求,通过中国知网的大数据,检索出最合适的作者进行精准约稿。其次,调研这些作者的论文数量、被引次数及期刊等级,建立组稿梯队:重点、一般及候补。再次,应主动与校内院系、图书馆、科研部门等密切联系,关注最新的科研动态,引导相关研究人员进行撰稿,确定约稿内容。另外,编辑还可利用两微一端等新媒体进行约稿,如在微信社区中发布约稿函,开展约稿的新社交。
(4)优化审稿与专家库。①判断来稿质量,给作者分级。首先,从CNKI知网等数据库,获取作者以往的刊物层次、论文被引等,从外部预估作者投稿的水平。其次,由CNKI的学术热点及趋势搜索,以及题目、关键词判断研究方向的选题热度与重要度。再次,根据作者论文中介绍的前人工作及本文的创新点,从论文本身预估其创新性。最后,再结合论文的排版,综合判断来稿的质量,并对来稿作者进行分级。②优化专家库,对专家评级。建立“自动”的审稿专家库,根据学科专业和研究方向自动发送审稿,如无响应,则自动派发下一位专家直至审回。应评出优秀、合格与不合格的专家,对质量高、时间短的审稿专家,系统应能自动前移。若库内没有合适的审稿专家,可以通过中国知网等数据库将其加入,也可以利用“两微一端”等自媒体来随时扩建专家库。③增加开放评审,设置快审通道。专家评审仍采用双盲审稿。但在设定的评审期内,接受大众评议及公开投票,并分别给予专家和大众评审不同的权重,实现量化评审。时效性要求的稿件,可以设置快速审稿通道,例如:考虑用微信等自媒体,组建一个临时讨论组,快速评审稿件。
(5)优化编辑校对。对于在校学生,需加强在线指导以规范其论文投稿及写作,还可以编制作者自检指南、稿件自查表等。当作者稿件上传至采编系统后,应能自动识别稿件格式。与要求不符的,自动返给作者修改。
现在很多编辑加工的内容是重复的,如相同的专业用语、
参考文献等,可运用如三才的NoteFirst
参考文献编校系统、周丽的检查数据单位的Excel文档等,将节省编辑大量的精力。
“见文不见刊”的时代,编辑应编好每一篇文章,特别是文章题目的标注、关键词的修改等,更应引起特别重视。“小屏阅读”需要大篇幅凝练及二次加工,当编辑完成Word排版工作后,用XML语言对每篇文章的内容进行多媒体的拆分、标注,最后期刊再整体利用XML软件转为HTML文件,实现全流程的数字化出版,并实现由平面编辑→多媒体编辑的转型。
(6)出版发行、交流传播、服务营销。现在应借助中国知网、微博与微信、今日头条等,随时随地通过学术圈社交平台交换、发布学术信息、公布选题计划、开展学术讨论。学术期刊对读者免费、开放获取,实现传播最快化。应用RSS等,扩大发行范围。“一种内容、多种媒体、同步出版”,全方位地展示自己的学术成果。坚持“录用一篇、出版一篇”的原则,将每篇文章设置一个二维码,多产品数字出版,如优先出版、网络首发、数据论文、语义出版、增强出版、预出版、超星域出版、HTML5等。学术内容自身有一定的时效性,定期整刊→“随时、分篇”所取代,且可以用“E-ONLY”、先发后审、单篇出版等出版论文。
学术期刊可对每个用户的需求了如指掌。大量阅读数据,如读者构成、阅读好恶、阅读时间、笔记内容……,通过这些读者在网上留下的“脚印”,精准地进行“用户画像”,并更好地为他们服务。做好读者满意度调查及交流服务,会更有助于增加用户黏性及忠诚度。
学术期刊可以将资源高度整合后,可以靠卖移动终端、卖客户链,以及链接到企业网站收取广告费、流量费及服务费来盈利。其他多种新型的盈利模式,如微信的原创文章打赏,微博的收费问答等也不断涌现。众筹,众包,按需生产,分页购买等多种创新出版模式比比皆是。
(7)人员与管理。学术期刊的困境,根本上源于人的困境:①要有足够的人员。如果无法调配,也可暂聘兼职编辑,以弥补人员不足的问题。②要加强编辑培训。让编辑多参加业务以及科研培训,对青年编辑采用“导师制”,充分发挥老编辑“传帮带”作用; 此外,还应鼓励编辑读取在职“研究生”,让编辑逐步成才。③提升编辑的多种能力。大数据时代,除了具有编辑加工能力外,编辑还要有网络版权和安全意识,以及更强的社交能力,要努力成为学者型、记者型、销售型编辑。④打造编辑人才数据库。与其他期刊合作,共同实现优秀编辑人才的资源共享。⑤编辑部还要大胆的进行体制创新,才能吸引众多优秀的人才。
(8)刊内校内融合。首先,要做好刊内多媒体融合,利用“两微一端”等新媒体,以取得综合传播效果。然后,再进行校内融合,将分散于各部门如科研处、研究生院、图书馆等的校内读者数据,关联利用。
利用大数据的软硬件技术,通过接收来稿、会议交流、网络搜索以及“两微一端”等多种渠道,学术期刊仍可建立自己独立的“准大数据”平台。并将作者、专家、读者等“准大数据”资源,灵活地融入到出版流程当中。但应注意到,它建立的并不是真正的大数据平台。因为大数据的“海量”“庞杂”与编辑部根本不沾边。目前,仅有BAT(百度、阿里巴巴、腾讯)等才拥有真正意义上的“大数据”。再者由于知网等数据库的“平台聚集”效应,短期内聚集起大数据也不可能。况且现在人、财、物及技术的门槛都很高,反而不如在现有流程中运用“大数据思维”来的更方便有效。以后随着大数据及云计算技术的不断发展及门槛的逐渐降低,对于较大的学术期刊或联盟来说也将是一种选择。
社交网站——“人与人”(如腾讯),搜索引擎——“人与信息”(如百度),电子商务——“人与商品”(如京东),电子支付——“人和资金”(如支付宝),而大数据解决了——“人和服务”的问题。大数据将使出版业的融合扩大与加速,从而使人与服务的联结成为可能。内部加速整合,外部不断融合,这已是大势所趋。
(1)刊-刊融合——先与其他期刊合作。在发达国家,80%市场掌握在20%的集团手中[11]。目前,期刊的竞争已是集团间的竞争,绝非“单打独斗”。仅依靠期刊自身,很难在“论文海洋”和“期刊森林”中引起关注。应本着“自愿”的原则,组建期刊联盟,“抱团取暖”,在联盟内统一投稿、查稿和审稿。发挥“资源、品牌、竞争”优势,共同做大做强。目前联盟主要有有两类:一类由行业学会主导,如中国地质学会组建的“中国地学期刊网”; 另一类是特殊集群,如“中国高校系列专业期刊”。
(2)刊-网融合——再与出版平台合作。这里的“网”,是指知网等网络出版平台。学术期刊或联盟,为克服技术和资金不足等问题,选择中国知网等出版平台作为合作对象,依托其规模化与专业化的优势“借船出海”,“中国高校系列专业期刊”便是如此。
(3)刊-网-馆融合——后与图书馆合作。学术期刊或联盟除与知网等出版平台合作外,再探索与图书馆等信息服务部门进行“刊-网-馆”融合[12],完成“内容生产商→信息服务商→知识服务商”的转变。
大数据要产生价值,前提是有数据可用,这正是当今出版业的短板。主要运用以下两种方式解决:一种是直接进行数据购卖。与电商平台、社交平台等数据拥有者进行数据买卖,实现双方的互利共赢; 另一种是数据外包服务。通过协议实现数据服务整体外包,出版企业只要数据的最终分析结果,即可进行选题的精准化策划与内容的精准推送。
学术评价的根本目标是为了鼓励学术创新。“期刊评价论文,机构评价期刊”,用大数据为期刊分级,有一定的合理性。但大数据时代,“见文不见刊”及核心期刊的弱化已是大势所趋。如果再人为的为期刊分级设定统计源,违背了大数据“一切数据平等”的理念。
在大数据时代,将全方位的评价论文和期刊。在评价主体上,对全社会开放,“表达平台”及“监督平台”将随之产生,其间的争议也将不证自明; 在评价指标上,不独重文献被引率,整体评价发表文献,过去受轻视的复合影响因子等众多指标,将重新分配权重; 在评价时态上,发表前客观预测,发表后实时跟踪; 在评价标准上,下载量、点击量、点赞量、投票量等大众指标也将进行统计,虽然其在学术性上相对较弱,但其广泛的用户量不容小觑。2017年9月,浙江大学《优秀网络文化成果认定实施办法(试行)》,将发布于网媒的原创作品认定为“学术论文”,并首次纳入职称评定、评奖评优的考核范围,这是论文评价方式的一次变革。大数据也给普通期刊提供了一个“弯道超车”的机会,只要文章足够优秀,就能享受大数据多元化评价带来的优势和便利。现在跨数据库的大数据学术评价,也已经开始尝试。评价成员的大众化、指标的多样化、标准的综合化,将推动学术期刊评价体系日益的科学化。
人们常说“钱不是万能的,但没有钱是万万不能的”。同样,大数据也不是万能的。大数据中自媒体的数据尤其真伪难辨,并且即使是真实的数据,也会因算法的不同而产生不同的解读。大数据最终是为人所用的,且整个过程都贯穿了人的价值选择,所以人在其中仍起着举足轻重的作用。
人们见证了大数据的神奇,也给大数据带上了“神秘”的光环。没有数据的决策是不科学的,但大数据的预测也未必都靠得住,它反映的是概率问题,只是提供了一种可能。如果缺乏深度谨慎的分析,仍可能会犯大错。不能过于依赖大数据而影响人的主观思考,否则将走入唯数据论、数据决定一切的“大数据主义”。
面对“大数据”热,还应当冷静的看到,大数据只是迎合了多数人的偏好,未必有“正能量”。尤其是编辑肩负着“把关”的使命,更应避免成为低级媚俗、唯利是图的“帮凶”。要秉承“社会效益”优先的思想,为高质量的出版发展服务。
大数据最大的价值也许不在于技术本身,而在于大数据的思维。对于学术期刊来说,应规划自己的大数据“蓝图”。首先,应尽可能的搜集所有数据和资料,越全面越详细越好。其次,还要具有分析数据的能力。不少编辑认为大数据仅是巨头间的竞争,自己拥有的只是“小数据”。其实不管数据大小,用好了,都可以发挥作用。大数据的构成基础是“小数据”,如果大小数据结合起来效果会更佳。对那些管理问题成堆的期刊,最重要、最急切的问题不是大数据能够解决的,大数据只会锦上添花。如果小数据都用不好,绝不可能指望大数据。应先完善自身,再用大数据去重塑。
学术期刊利用大数据,我们还有许多的事要做,还有许多的路要走。
国家层面。应强调大数据立法及数据安全,因为大数据“杀熟”和个人隐私“裸奔”已比比皆是。国家还应该公开一些可以公开的大数据“为民所用”,并鼓励大数据的授权与转让,以便期刊在为数据库提供数据的同时获得自己所需的用户数据。这都需要国家层面的调控管理和互联互通机制的形成。
学校层面。学校应协调与学术期刊有关的校内各部门,进行数据的互联互通,最好能统一制定学校的“大数据规划”。领导应从人、财、物各个方面为大数据提供软硬件支持,对学术期刊更要“扶上马,送一程”。
编辑部层面。要多方面联合,先进行内部整合,再尝试外部融合。内部先补足人员,并从科研处及图书馆补足内部数据,再与校外期刊联合,抱团取暖,组建期刊联盟应对大数据。
另外,学术期刊现在最大的风险是犹豫观望、错失良机,“留给学术期刊的时间不多了”。“领导重视+转变思维+勇于创新”,是高校学术期刊战胜一切困难的必胜法宝。我们将努力实现学术期刊的完美转型,大数据之路充满着希望但任重而道远。