本文是一篇医学论文,本研究在模型的指标选取阶段引入了一种基于专利综合价值的新兴技术识别指标体系。将专利的个体属性和网络属性相结合,优化识别模型。
第1章绪论
1.1研究背景与意义
1.1.1研究背景
新一代技术发展的大环境下,大数据与人工智能等技术的不断发展使得许多技术领域发生着各种各样的变革。2015年,中国工程院联合国家科学基金委启动了“到2035年中国工程科技战略研究”项目[1],对未来20年的工程科技与技术战略发展进行战略预测。该项目旨在对未来20年内工程科学与技术的战略发展进行预测,以达到以创新发展带动我国社会和经济效益的可持续发展。要达到这一目的,关键在于从各种产业技术中找出发展潜力大、效益高的战略性创新技术,使之成为推动整个社会发展的动力。
在当前“十四五”时期创新发展的道路上,各种新技术不断涌现,改变着全球竞争格局和国家力量对比。新兴技术对中国竞争力和国际地位具有重要影响,是科技强国建设的有效途径。《国家创新驱动发展战略实施纲要》《“十四五”规划纲要》等一系列重要文件[2,3],提出了国防科技领域的新兴技术发展和企业创新相关措施,指出必须把创新摆在我国现代化建设全局的关键位置,以创新促进发展,充分形成发展新优势。
新兴技术的出现有可能带来新的市场机会[4]。新兴技术的识别是近年来国家科技研究和企业创新活动的重点。专利被认为是技术创新的载体,因此被作为是识别新兴技术的重要数据源[5]。识别新兴技术的方法也在不断地发生变化。要结合新技术本身的特点以及与市场、企业等其他因素的关系,探索或改进识别新技术的方法,尽可能完整、准确地识别新技术,预测技术发展的趋势,为产业化和创新提供信息支持。新兴技术识别对新兴技术的产业化具有重要的现实意义。
1.2国内外研究现状
1.2.1新兴技术识别方法研究
新兴技术识别方法可以定性分析法和定量分析法两类[6]。定性分析法建立在决策者智慧与专家主观判断的基础之上,是早期研究者对新兴技术识别进行探索的主要手段,主要有头脑风暴、德尔菲法等;以此为基础,又引申出问卷调查法、技术定义法、情景分析法以及技术路线图等。定量分析法是一种从客观数据中识别新兴技术的方法,主要有科学计量分析、文本挖掘和社会网络分析等。
文献计量法在技术预测领域中是常用的一种方法,新兴技术的出现常常预示着科技文本中相应文献计量学特征的产生[7]。相应的文献计量法这种定量方法,显著提高了技术预测准确度。文献计量方法以构建评价指标为主要方法,而新兴技术的评价指标也愈加丰富多样,从最初的单一指标到逐渐完善的多维度衡量指标体系。Song K等[8]从专利的适用性、影响力和持续性3个维度测度专利是否有发展成为新兴技术的可能,并与市场指标相结合进行综合评价;王吉武等[9]将文献计量的方法作为切入点,从技术机会、技术成熟度和技术地位3个角度构建了评估新兴技术商业化潜力的研究框架;李蓓等[10]提出一种以专利引用耦合聚类为基础,并通过对技术集群的专利授权时间、专利数量年增长率、专利权利要求项数3个指标的计算方法,识别出了纳米领域的两项新兴技术;黄璐等[11]用网络中心度来度量技术主题的影响力,在特定行业识别新兴技术主题。
第2章相关理论基础
2.1新兴技术定义与特征
2.1.1新兴技术定义
2000年Day对新兴技术的定义是:“一项基于科学的创新,具有建立新行业或改造现有行业的潜能”[49],这一定义突出了新兴技术所具有的创新性。关于如何识别和判定技术是否属于新兴技术,学术界和产业界还没有形成统一的共识。国内学者也从不同视角尝试界定了新兴技术定义,21世纪初期,赵振元[50]、李仕明[51]、杨雪[52]等分别在强调新兴技术时间特性,学科基础,高度不确定因素以及在市场或者行业中的作用等角度对新兴技术界定做出了不同阐述。近年来,学者们逐渐意识到新兴技术与传统技术相比具有更大的发展空间和潜力,因此新兴技术识别成为了学界关注的焦点。近年来,新兴技术识别越来越受到学者关注,与此同时对新兴技术本质内涵的探索也越来越深入,新兴技术的定义也因此有了更为一致的表述。多位学者[10,53,54]均进一步强调了新兴技术可能会对市场产生的重大影响以及新兴技术本身迅猛发展的趋势。
综上,尽管新兴技术定义仍由多种界定,但是其共同之处在于新兴技术既具备时间层面的特征,也具备效应层面的特征,即时间因素上是正在生成或者崛起中的,具有较高的发展潜力和应用前景;效应层面上是对行业或者产业经济未来的发展而言,可能产生重大影响。因此,本文将从这两个角度来理解新兴技术的内涵及其作用机制。新兴技术的发展多集中于“新”与“兴”这两个字[6]。所谓“新”就是在技术上有所革新,包括时间上的革新,内容上的革新,“兴”是指方兴未艾、层出不穷的技术。
2.2离群值与离群专利内涵
2.2.1离群值内涵
对于离群这一概念,最早起源于国外的“Outlier”一词,这些值和其它观察结果偏差太大,以致使人们对其形成机制提出质疑,怀疑它是由不同的机制产生,而非纯随机数。由于这个原因,离群现象一直受到学者们的关注和重视,并对其进行了大量的实证分析。国内的研究常将其译作“离群值”或者“异常值”、“离群数据”。随着科学技术的发展和应用,人们对其认识愈加深入。统计学上把离群值定义为平行测定的一组值,如果有单个数据和平均值相差很大,则将该数据称为离群值[60]。由于离群数据一般能够揭示出一些不寻常但却有价值的信息,因此离群检测很重要,通常用于异常检测、离群探测、孤立点检测等等[61]。
离群数据的离群性具有暂时性、相对性、转移性。对于离群数据而言,它不是指数据集本身存在着某种性质或特征,而是一种特殊情况下所出现的现象和状态。数据对象离群性具有转移性,也就是某数据对象处于某时段,它具有相对较强的离群性,但下一个阶段,它的离群性很可能会减弱。这种转移性并不只体现为时间的转移,并表现为研究目的各异,也就是一些情况,数据对象离群性明显,但也有一些时候,它的离群性越来越小。也就是说,有些数据资料的离群现象会随时间和条件发生改变而产生变化。就像我们常说的话一样,对有些情况下,这一部分资料属于“噪声”范畴,但是当形势变化,它们又有珍贵的价值。
第3章 基于离群专利的新兴技术探测方法 ......................... 16
3.1 基于离群专利的新兴技术候选数据集筛选 ................................ 16
3.1.1 专利相似矩阵构建 .......................... 16
3.1.2 离群专利筛选 ................................... 17
第4章 实证研究—以生物医药领域为例 .............................. 28
4.1 专利原始数据集构建 ......................................... 28
4.1.1 数据来源与处理 ............................ 28
4.1.2 数据描述性分析 ................................... 29
第4章 实证研究—以生物医药领域为例 ................................ 28
4.1 专利原始数据集构建 ........................... 28
4.1.1 数据来源与处理 ................................ 28
4.1.2 数据描述性分析 ........................................ 29
第4章实证研究—以生物医药领域为例
4.1专利原始数据集构建
4.1.1数据来源与处理
本文研究对象选取生物医药技术领域专利数据验证方法的有效性。生物医药产业作为我国大力发展的战略性新兴产业之一,国家高度重视,相继颁布《健康中国2030规划纲要》《“十四五”生物医药产业发展规划》等多项政策,为行业发展带来清晰而广阔的市场前景。预测该领域未来可能出现的新兴技术,对及时把握机遇具有重要意义。
本研究选取PatSnap智慧芽专利数据库作为数据检索源[96,97]。检索2016-2021年的生物医药专利数据,将其划分为2016-2018年和2019-2021年2个时间段;依据国际专利分类法(International Patent Classification,IPC)及《国际专利分类与国民经济行业分类参照关系表(2018)》以及已有文献[96]中关于生物医药IPC分类号的界定,选取专利IPC分类号,主要包括:A61K38/00、A61K39/00、A61K48/00、C12M、C12N、C12Q、C12P、C07H21/00、C07K14/00、C07K16/00、G01N33/00。将上述分类号作为关键词专利数据库中进行检索,为实现样本精确定位到生物医药领域,本研究进一步选取代表性的主题关键词纳入检索式,主要包括:基因、细胞、酶、蛋白、血清、核酸、氨基酸、肽、核苷酸、维生素、介素、疫苗、菌苗、抗体、抗生素、干扰素、抑制剂、凝血剂、交联剂、诊断试剂、制剂、试剂、克隆、移植、重组、转基因、制备办法、构建方法。专利应用领域国民经济分类号限制在C2761、C2762,以确保所涉专利与医药的高度相关性[97]。筛选申请日为2016-2021年的专利,剔除未获得授权的专利,剔除外观设计类专利专利。
第5章结论与展望
5.1主要研究结论
本研究从离群专利的视角出发,采用机器学习算法构建新兴技术识别模型探测新兴技术,基于专利相似度筛选出离群专利,根据新兴技术特征提出了基于专利综合价值的新兴技术识别指标体系,基于专利综合价值的新兴技术识别指标体系构建了离群专利指标与新兴技术识别信号之间的关系模型,通过对领域当前的离群专利进行探测识别潜在的新兴技术。
主要研究结论如下:
(1)利用机器学习算法构建了一种基于离群专利的新兴技术探测方法。生物医药领域的实证研究证明,该方法是有效的,是对现有新兴技术探测研究方法的丰富和拓展。
(2)XGBoost模型为首选的新兴技术识别模型。在新兴技术探测中,本研究拟合了高维度的专利指标和新兴技术识别信号之间的复杂关系,筛选出了XGBoost模型为首选的新兴技术识别模型。并初步地分析了各个指标在新兴技术识别过程中作用,本研究提出的方法有利于大规模专利数据的智能化分析,模型的输入指标一经专利公开即可获取,因此当新的专利数据输入到模型时,模型可快速准确地评价和预测输入专利是否有发展成为新兴技术的潜力。时间成本低,节省人力物力。
(3)识别出生物医药领域潜在的新兴技术主题。通过与领域现状和发展趋势对比,发现预测出的新兴技术发展趋势与现实中技术发展状况具有较高的吻合度,证实本研究所构建的基于离群专利的新兴技术探测方法是可行且有效的。
参考文献(略)