
经济管理前沿
Frontiers in Economics and Management
- 主办单位:未來中國國際出版集團有限公司
- ISSN:3079-3696(P)
- ISSN:3079-9090(O)
- 期刊分类:经济管理
- 出版周期:月刊
- 投稿量:3
- 浏览量:665
相关文章
暂无数据
公共数据开放能否推动城市协同创新?——基于多期DID模型的实证检验
Can the Opening of Public Data Promote Urban Collaborative Innovation? ——An Empirical Test Based on the Multi-Period DID Model
引言
数字化时代,数据已成为驱动经济社会飞跃、激发创新活力的核心生产要素。公共数据作为政府及公共机构履职过程中积累的宝贵信息资源,其开放开发步伐加快,成为推动数据要素市场发展的关键支撑。伴随电子政务向“智慧政府”、“一网通办”进阶,海量数据汇聚政府信息系统,其有效利用可为数字经济注入“燃料”,释放经济社会潜能,加速增长。国家已将公共数据开放上升至国家战略层面,通过2015年《促进大数据发展行动纲要》、2020年《关于构建更加完善的要素市场化配置体制机制的意见》、2022年《关于加快建设数据基础制度更好发挥数据要素作用的意见》等政策,构建顶层设计,明确其生产要素地位,指引通过开放共享挖掘价值,赋能数字经济与社会治理创新。
城市作为经济社会活动核心,其创新发展关乎自身竞争力与区域、国家创新体系构建。当前我国已基本形成以城市群为枢纽的协同创新网络,公共数据开放作为促进共享、激发活力的重要举措,正成为推动城市协同创新的关键力量。城市协同创新通过跨区域、跨行业、跨部门的资源共享与优势互补,整合创新资源、打破壁垒,凝聚合力提升创新效率与质量。
本文聚焦公共数据开放对城市协同创新的影响及内在机制,通过构建理论框架与实证分析,探究其影响路径与作用机理,剖析现存问题并提出对策。这一研究对挖掘公共数据价值、推动城市协同创新发展,兼具理论与现实意义。
一、研究假说与机制分析
(一)公共数据开放对创新协同性的影响路径
公共数据开放对城市协同创新的影响机制是一个多维度、动态化的过程,涉及数据要素的流通、知识溢出效应、创新主体互动以及制度环境的优化。蔡跃洲等人指出,数据要素是驱动效率提升的关键,在于从数据中提炼有效信息并付诸应用,从而降低企业运营的不确定性。公共数据开放使各类主体能够便捷获取外部环境信息,大幅削减信息搜寻成本;同时,政府数据的权威性与准确性,也显著降低了数据甄别与验证成本。这一双重成本优化,为创新活动释放了更多资源空间。还帮助各个主体借助多维度的公共数据,更好把握宏观经济环境,了解市场和竞争环境。沈坤荣等研究强调,鉴于数据要素与数字技术创新间存在紧密的内在关联,相较于其他技术领域,公共数据的开放共享对数字技术创新的推动作用更为显著。李北伟等的研究显示,政府数据的开放举措,通过吸引科技人才汇聚、激发创新创业活力及改善营商生态,在创新资源整合、创新主体培育及创新环境营造三大层面,有力推动了城市整体创新能力的跃升。Carayannis提出了数据开放促进“政府-企业-研究机构-市民”四螺旋协同,这使得创新网络被重构。公共数据的开放是构建数字政府不可或缺的一环,也是推动其发展的关键力量。许乐等揭示,通过增强政府透明度,数字政府建设能有效激发企业的创新投资热情,朱春燕认为数字政府建设的政策措施,对提升区域创新的投入与产出水平起到了积极的促进作用。吴金鹏等发现,政府数据开放政策的实施,在时间线上历经了从缓慢到快速的显著变化阶段;在空间维度具有邻近效应、梯度效应和集聚效应,优化了城市协同创新的制度环境。构建开放、协同的公共数据开发利用生态,是驱动经济社会转型、赋能实体经济发展的关键路径。
(二)公共数据开放影响城市协同创新的传导路径
1. 公共数据开放、金融集聚与城市协同创新
公共数据开放能够打破信息壁垒,降低金融机构获取信息的成本,使得金融机构更易获取企业经营、市场动态等关键信息,从而吸引更多金融机构在城市集聚。同时,开放数据还能为金融创新提供数据支撑,拓展金融业务边界,增强城市对金融资源的吸引力,进一步促进金融集聚。金融集聚能为城市协同创新注入充足资金,同时帮助创新企业降低融资成本、缓解融资压力,同时金融机构集聚带来的知识外溢效应,有助于各类创新主体掌握更丰富的金融知识,接触新颖的创新思维,进而充分调动协同创新的参与热情,助力城市整体创新能力实现稳步提升。何凌云等指出先进城市信息技术发展促进了金融业的便捷性、灵活性、即时性和高效性,有效促进金融发展。洪银兴认为创新主体间存在信息传递滞后,可能导致决策失误,加剧多方合作创新风险。独立于创新体系之外的金融中介,通过监督与激励机制有效破解信息不对称难题,增进相互信任,进而推动合作高效开展。
2. 公共数据开放、资源配置效率与城市协同创新
公共数据开放能够让企业、政府和社会机构更全面、准确地了解市场供需、资源分布等情况,减少信息不对称,资源便能更精准地流向急需的领域与主体,优化资源配置,提升资源利用效能。高效的资源配置能够确保创新资源精准投入到具有创新潜力的企业和项目中,避免资源浪费,加速创新要素的流动和整合,促进企业、高校及科研机构等创新力量高效聚合、深化合作,推动城市协同创新迈上新高度。Glaeser等认为要素配置扭曲抑制产学研主体创新活力,制约城市创新水平提升。信息障碍直接阻碍要素资源的合理配置,方锦程等研究发现,公共数据开放能够破解这一关键难题,加速创新要素自由流通,激发了城市协同创新活力。
基于上述理论分析,提出如下研究假说:
假设1:公共数据开放对城市协同创新具有正向影响。
假设2a:公共数据开放通过提升金融集聚水平,进而驱动城市协同创新。
假设2b:公共数据开放通过优化资源配置效率,进而驱动城市协同创新。
二、研究设计
(一)模型构建
本文以城市公共数据开放平台建设进程和时间差异为准自然实验,运用多期双重差分法(DID)模型,深入分析公共数据开放举措对城市协同创新的综合影响。具体而言,模型设计如下:
coinit=α+βopenit+γcontrolsit+ηi+μt+εit (1)
在模型中,下标i对应城市,t对应年份。被解释变量coinit用于评估城市i在t年份的协同创新水平;解释变量openit是反映公共数据开放情况,若城市i若在t年或之后开通公共数据开放平台,取值为1;反之则取0;为排除其他因素干扰,选取经济发展水平、产业结构、财政分权度、实际使用外资、金融发展水平、人口密度和科学支出等城市协同创新能力影响因素作为控制变量controlsit;ηi和μt分别对应城市固定效应和年份固定效应,用于剔除基准回归中不随城市个体或时间变化的干扰因素;εit代表的是随机误差项。在本文的研究中,最为核心的系数是β,它用于评估公共数据开放对城市协同创新所产生的作用效果。当β值呈现显著正向特征时,表明公共数据开放能够有效增强城市协同创新能力。
(二)变量选取
1. 城市协同创新
城市协同创新本质上是不同创新主体所拥有的知识、人才等创新要素,在不同城市间实现的有序汇聚。本研究借鉴了谢其军等人的研究方法,以城市间合作专利的“每百件申请数量”衡量协同创新水平,通过incoPat全球专利数据库检索联合申请发明专利,结合共同申请人信息筛选数据,并整合发明专利申请人的全部地址信息,统计城市间合作形成的专利数量。当某专利存在三个申请人且分别来自A、B、C三个不同城市时,参考Sun等的研究(2015),提取三组城市间合作数据,即A-B、B-C、C-A。
2. 公共数据开放
构建一个政策处理变量,用于识别城市i从第t年开始是否已上线公共数据开放平台。若某城市在指定年份或之后上线了平台,赋值为1;反之,则赋值为0。
3. 控制变量
经济发展水平:城市人均GDP的自然对数;产业结构:第三产业增加值占GDP的比例;财政分权度:政府预算收支比;对外开放水平:实际利用外资占GDP的比重;金融发展水平:年末金融机构贷款余额与GDP的比率;人口密度:年平均人口与行政区域土地面积的对数比率;科技支出:科学支出占GDP的比重。
(三)数据来源
由于《中国城市统计年鉴》数据更新存在滞后性和部分数据存在严重缺失,同时发明专利申请至公开的周期一般为2至3年,采用2010-2021年268个城市层面的面板数据展开研究。合作专利数据取自incoPat数据库,城市层面数据源于《中国城市统计年鉴》及各大城市官方发布的统计公告。对缺失值运用线性插值法补全。
三、实证结果与分析
(一)基准回归结果
为了厘清二者间的具体影响,对模型(1)进行回归分析。表1呈现具体回归分析结果,第(1)列为未控制其他因素时的基准回归结果,第(2)列加入经济发展水平和产业结构等经济变量,第(3)列进一步纳入人口密度与科学支出。三列系数均在1%水平显著为正,且差异较小。第(3)列显示,公共数据开放对城市协同创新的估计系数为1.801。这意味着在其他变量不变的情况下,公共数据开放对城市协同创新起到了显著的推动作用,凸显了公共数据开放对协同创新的促进效应的经济价值。
| 变量名称 | (1) | 城市协同创新(2) | (3) |
|---|---|---|---|
| 公共数据开放 | 2.330*** | 2.329*** | 1.801*** |
| 经济发展水平 | (0.687) | (0.687)
-0.673 (0.846) |
(0.574)
-1.278 (0.846) |
| 产业结构 | -2.910
(2.487) |
-1.454
(2.307) |
|
| 财政分权度 | 0.170
(2.417) |
0.869
(2.329) |
|
| 对外开放水平 | -37.130**
(16.746) |
-47.214***
(16.209) |
|
| 金融发展水平 | 0.573
(0.685) |
0.264
(0.639) |
|
| 人口密度 | 5.997*
(3.102) |
||
| 科学支出 | 667.559***
(186.478) |
||
| 常数项 | 0.607**
(0.285) |
8.747
(8.965) |
-21.469
(19.127) |
| 城市固定效应 | 是 | ||
| 时间固定效应 | 是 | ||
| R2值 | 0.176 | 0.187 | 0.240 |
| 样本量 | 3216 | ||
注:*、**、***依次对应10%、5%、1%的显著性水平,括号内为稳健性标准误。下表同。
(二)平行趋势检验
公共数据开放对城市协同创新发挥着显著的正向驱动作用。值得注意的是,多期双重差分模型能够有效运作的一个重要前提预设是,在公共数据开放尚未推行之时,实验组与控制组之间的城市协同创新趋势应维持稳定状态。不应随时间推移而发生显著变化,确保两组的整体态势趋于一致。为验证平行趋势假设,本文构建如下回归模型开展检验:
coinit=α+βk∑openit+γcontrolsit+ηi+μt+εit (2)
其中,k为公共数据开放实施年份的序数,鉴于公共数据开放举措于2012年正式启动,且样本数据的收集周期持续至2021年,因此k的取值范围设定为上限9、下限-11。为避免多重共线性问题,选定公共数据开放前一年作为基准参照期。在此设定下,系数βk所揭示的是,与公共数据开放前的时段相比,开放后的第k年,实验组与控制组城市在协同创新方面的差异特征显示,公共数据开放平台正式投入使用前,两组间未出现显著差异,这与平行趋势假设的检验要求相符。待该平台正式上线后,政策效应开始显著增强,且随时间推进,效应持续扩大。这表明政策实施后,处理组的效应与对照组相比有了显著的提升,这可能是公共数据开放平台上线的效果,这一结论清晰说明(见图1),公共数据开放能够显著促进城市协同创新的发展。
(三)稳健性检验
1. 安稳剂检验
考虑到处理组城市和对照组城市的协同创新差异是由时间变化导致的,因此本文分别将公共数据开放平台上线时间年份提前两年和三年,表2第(1)列和第(2)列分别列出具体回归数据,政策变量open的系数估计未通过10%显著性水平检验。这进一步验证了处理组与对照组城市的时间趋势无系统性差异,也再次证明了公共数据开放促进了城市协同创新。
2. 剔除直辖市样本
鉴于四大直辖市在经济发展水平和资源配置上的特殊性,在剔除四个直辖市样本的基础上,再次采用模型(1)进行回归分析,所得结果汇报于表2第(3)列。其中,估计系数依然呈现出显著的正向趋势,这证明了公共数据开放对城市协同创新产生了显著的促进作用。
3. 更换模型设定
本文的基准回归分析主要借助OLS方法,以探究公共数据开放对城市协同创新的影响。但直接采用普通面板模型估计可能产生估计偏差,本文选用Tobit回归模型开展稳健性检验,结果如表2第(4)列所示,该检验进一步验证了基准回归结论的稳健性。
4. PSM-DID
考虑到公共数据开放平台上线城市与没有上线城市可能存在系统性差异,同时,双重差分法虽能有效识别政策平均处理效应,但需警惕的是,由于公共数据开放具有非随机性特征,可能存在潜在的选择性偏差风险。因此,本文通过倾向得分匹配法进行补充验证,进一步验证回归模型结论的稳定性。参考过往研究的经验,采用1:4近邻匹配与核匹配策略。具体操作流程概述如下:将上述的控制变量作为匹配的关键变量;进一步地,借助1:4邻近匹配技术与核密度匹配方法,本文精细挑选出满足公共数据开放共同支撑条件的最优对照组样本,进而通过多期双重差分模型对公共数据开放的城市协同创新效应展开深入评估,相关回归结果详见表2第(5)列和第(6)列。估算结果表明,公共数据开放项的回归系数持续呈现显著正向特征,为基准回归结论的稳健性提供了额外有力支撑。
| 变量名称 | 安慰剂检验 | 剔除直辖市样本 | 更换模型设定 | PSM-DID | |||
|---|---|---|---|---|---|---|---|
| 提前两年
(1) |
提前三年
(2) |
(3) | Tobit回归
(4) |
1:4近邻匹配
(5) |
核匹配
(6) |
||
| 公共数据开放 | 0.144 | -0.023 | 1.624*** | 1.727*** | 1.847*** | 1.847*** | |
| (0.316) | (-0.056) | (2.797) | (6.644) | (3.148) | (3.148) | ||
| 常数项 | -23.341 | -23.722 | -10.201 | 9.243 | -15.626 | -17.280 | |
| (-1.168) | (-1.189) | (-0.723) | (1.240) | (-0.886) | (-0.989) | ||
| 控制变量 | 是 | ||||||
| 城市固定效应 | 是 | ||||||
| 时间固定效应 | 是 | ||||||
| R2值 | 0.229 | 0.229 | 0.239 | — | 0.764 | 0.223 | |
| 样本量 | 3216 | 3216 | 3168 | 3216 | 3171 | 3171 | |
5. 工具变量法
尽管上述研究已从多个角度进行了深入探讨,一定程度上缓解了内生性问题,但可能有逆向因果关系或变量缺失等的影响,这些因素可能干扰估计结果的准确性。因此运用工具变量法,以削弱潜在的内生性问题。具体地,公共数据开放平台上线与城市原本的通信基础设施建设相关,早期通信基础设施较好的城市可能更具备数据开放的技术条件或政府治理能力。参考黄群慧等的研究思路,选取2000年本地电话年末用户数作为城市通信基础设施水平的代理变量,以此构建工具变量。其一,各地在2000年就拥有较多的本地电话用户,说明该城市在通信技术方面有一定的积累,这可能使得该城市在后续的信息化建设中更具优势。公共数据的开放过程,往往需要借助高速的通信网络作为支撑,以实现数据的快速流通与广泛共享。本地电话用户数较多的城市,其通信网络的覆盖范围和质量可能更好,这有利于公共数据开放平台的搭建和数据的流通,满足工具变量的相关性;其二,2000年的本地电话年末用户数是一个历史数据,它与当前城市协同创新的关系主要是通过公共数据开放这个中间环节来实现的,该过程不直接作用于城市协同创新,符合工具变量的外生性。由于2000年本地电话年末用户数是一个截面数据,借鉴罗奇等的研究方法,采用本地电话年末用户数与公共数据开放平台上线年份的交互项作为工具变量(IV)。相关检验结果已汇总于表3中。第(1)列为第一阶段回归结果,工具变量估计系数为0.006,且在1%的水平下显著,验证了工具变量的相关性假设。第(2)列为核心解释变量公共数据开放的估计结果,其系数为11.365,同样通过1%水平的显著性检验且显著为正,进一步证明研究结论的稳健性。
| 变量名称 | 工具变量 | |
|---|---|---|
| 第一阶段
(1) |
第二阶段
(2) |
|
| 公共数据开放 | 11.365*** | |
| (8.286) | ||
| IV | 0.006***
(8.431) |
|
| 常数项 | -0.876**
(-2.570) |
|
| 控制变量 | 是 | 是 |
| 城市固定效应 | 是 | 是 |
| 时间固定效应 | 是 | 是 |
| Kleibergen-Paap rk Wald F | 71.086[16.38]
262.091 P=0.000 |
|
| Kleibergen-Paap rk LM | ||
(四)机制检验
1. 金融集聚
借鉴陶峰等的研究,采用地理密度指标来评估城市金融聚集程度,具体计算方法参照以下公式:
(3)
其中,表示城市i在第t年金融集聚水平,表示城市i在第t年金融机构贷款余额,表示城市i在第t年行政土地面积。回归结果如表4第(1)列。公共数据开放的估计系数为0.039,在1%水平上显著为正,这意味着公共数据开放平台的上线,显著优化当地投资环境,提升城市金融集聚水平,进而通过促进多方协作与技术研发融资,推动城市协同创新。
2.资源配置效率
借鉴刘诚等的研究,采用生产函数模型对各城市要素市场扭曲程度进行测度。研究整合资本与劳动力两大关键要素的扭曲程度,计算得到总体市场扭曲指数,并以该指数与城市中最大扭曲指数的比值,构建衡量各城市资源配置效率的新指标。回归结果如表4第(2)列所示,估计系数为0.013,且在5%的显著性水平下显著为正,这表明公共数据开放能够有效优化资源配置、缓解信息不对称,进而对城市协同创新发展产生推动作用。
(五)异质性分析
不同规模的城市在经济基础上存在较大差异,可能会影响公共数据开放对城市协同创新的效果。依据人均GDP中位数对样本城市进行规模划分,将人均GDP低于中位数的城市归为中小规模城市,其余为大规模城市。针对两组城市分别开展异质性检验,表4第(3)列和第(4)列所示。公共数据开放在大型城市的估计系数显著为正,在中小型城市未通过显著性检验,表明政策效果呈现明显的规模异质性。原因在于,中小城市受限于资源禀赋与技术能力,在数据采集、处理和开放应用等环节存在短板,公共数据开放初期难以形成规模效应,对协同创新发展的推动作用相对较弱。此外,不同规模城市在创新主体的数量和活跃度上存在差异,大型城市多元创新主体间的互动频繁,数据共享与协同创新的需求强烈,公共数据开放能够有效激发创新活力,而中小型城市创新主体相对较少,公共数据开放后协同创新的联动效应不足。
四、结论与启示
本文以城市公共数据开放平台上线为准自然实验,基于2010-2021年268个地级市面板数据与城市间合作专利数据,采用双重差分模型,系统分析公共数据开放对城市协同创新的影响效应、内在机制及区域异质性。核心研究结论如下:公共数据开放显著提升城市协同创新水平。基准回归结果显示,公共数据开放平台上线后,城市间合作专利申请量显著提升,验证了公共数据作为关键生产要素对跨区域创新合作的驱动效应。机制检验表明,公共数据开放通过双重路径赋能城市协同创新:一是促进金融集聚,为协同创新提供资金保障,有效降低创新主体融资约束,强化协同创新资金支撑;二是优化资源配置效率,缓解跨区域、跨主体信息不对称,引导资源向高附加值创新领域与核心主体精准配置,夯实协同创新资源基础。异质性分析显示,公共数据开放的协同创新促进效应存在显著区域与城市规模差异:从城市规模看,对大型城市的促进作用显著强于中小型城市,核心原因在于大型城市经济基础雄厚、数字基础设施完善,具备公共数据开放红利的高效转化能力;从区域分布看,对东南部地区城市的赋能效果显著,对西北部地区则无显著影响,这与东南部地区经济发展层次高、基础设施完备、人才储备充足的比较优势密切相关。
根据以上结论,提出如下建议:
第一、分级分类开放,兼顾区域均衡。对东南部地区及大型城市,扩大产业创新、科研合作等高价值数据开放范围,打造先行示范区;对西北部地区及中小型城市,优先开放基础公共服务数据,降低准入门槛并配套技术指导,培育数据利用能力;建立跨区域协调机制,推动跨区域、跨规模城市数据共享,缩小创新差距。
第二、强化中介赋能,放大协同效应。依托公共数据平台搭建金融对接模块,整合企业与科研数据支撑精准授信;引导金融资源向跨区域协同创新项目倾斜,设立专项基金支持数据驱动的联合研发与成果转化;构建资源配置监测体系,动态追踪要素流动,提升跨城资源配置效率。
第三、完善基建支撑,夯实创新根基。加大西北部及中小城市数字基建投入,实现开放平台全覆盖,提升数据存传与安全能力;推广低成本数据工具与标准接口,降低中小企业创新门槛;构建安全治理体系,明确开放边界与规范,强化脱敏及隐私保护技术研发,保障数据合规流通。
参考文献:
- [1] 蔡跃洲,马文君.数据要素对高质量发展影响与数据流动制约[J].数量经济技术经济研究,2021,38(03):64-83.
- [2] 沈坤荣,林剑威.链“岛”成“陆”:公共数据开放的技术创新效应研究[J].管理世界,2025,41(02):83-104.
- [3] 李北伟,朱婧祎,季忠洋.政府数据开放与城市创新——来自政府数据开放平台上线的经验证据[J].工业技术经济,2025,44(06):5-16.
- [4] Carayannis E G, Campbell D F J. “Mode3” and “Quadruple Helix”: Toward a21st century fractal innovation ecosystem[J].International journal of technology management,2009,46(3-4):201-234.
- [5] 许乐,孔雯.数字政府建设背景下政府透明度对企业创新的影响[J].贵州财经大学学报,2023(04):23-30.
- [6] 朱春燕,南锐.数字政府建设对区域创新水平的影响效应检验[J].统计与决策,2024,40(01):168-173.
- [7] 吴金鹏,韩啸.制度环境、府际竞争与开放政府数据政策扩散研究[J].现代情报,2019,39(03):77-85.
- [8] 谢其军,高杰,苏竣.基于准自然实验的地方政府合作与跨区域协同创新的关系研究[J].管理学报,2021,18(11):1612-1618+1713.
- [9] 何凌云,马青山.智慧城市试点能否提升城市创新水平?——基于多期DID的经验证据[J].财贸研究,2021,32(03):28-40.
- [10] 洪银兴.科技创新中的企业家及其创新行为——兼论企业为主体的技术创新体系[J].中国工业经济,2012(06):83-93.
- [11] 庄毓敏,储青青.金融集聚、产学研合作与区域创新[J].财贸经济,2021,42(11):68-84.
- [12] Glaeser E L, Kominers S D, Luca M, et al. Big data and big cities: The promises and limitations of improved measures of urban life[J].Economic inquiry,2018,56(01):114-137.
- [13] 方锦程,刘颖,高昊宇,等.公共数据开放能否促进区域协调发展?——来自政府数据平台上线的准自然实验[J].管理世界,2023,39(09):124-142.
- [14] Sun Y, Cao C. Intra-and inter-regional research collaboration across organizational boundaries: Evolving patterns in China[J].Technological forecasting and social change,2015,96:215-231.
- [15] 黄群慧,余泳泽,张松林.互联网发展与制造业生产率提升:内在机制与中国经验[J].中国工业经济,2019(08):5-23.
- [16] 罗奇,陈梁,赵永亮.数字基础设施建设与企业产能利用率——来自“宽带中国”战略的经验证据[J].产业经济研究,2022(05):1-14.
- [17] 陶锋,胡军,李诗田,等.金融地理结构如何影响企业生产率?兼论金融供给侧结构性改革[J].经济研究,2017,52(09):55-71.
- [18] 刘诚,夏杰长.线上市场、数字平台与资源配置效率:价格机制与数据机制的作用[J].中国工业经济,2023(07):84-102.
