欢迎访问 城市头条!城市大事,最早发现!Meet the good, record the facts!

城市头条官方微博   网站地图   城市号入驻

证监会携手庖丁科技 赋能资本市场前线监管

2018-11-16 20:39来源:编辑:News_张恺
近日,庖丁科技中标证券期货业金融科技研究发展中心(深圳)(以下简称“深交所”)——“证券文本信息抽取技术研究”项目,以证券市场文本信息为对象,研究利用自然语言处理技术,从披露公告中抽取指定的文...

近日,庖丁科技中标证券期货业金融科技研究发展中心(深圳)(以下简称“深交所”)——“证券文本信息抽取技术研究”项目,以证券市场文本信息为对象,研究利用自然语言处理技术,从披露公告中抽取指定的文本信息,并且满足具有一定技术性能指标要求的课题。

证监会携手庖丁科技 赋能资本市场前线监管

  资本市场上,信息披露作为法规,通常要求信息披露义务人“应当真实、准确、完整、及时地披露信息”。我国上市公司信息披露的内容大体可分为三类:证券发行文件、定期报告和临时报告。

  上市公司的公告信息披露必须在指定信息披露网站发布,主要为PDF格式。以深市上市公司为例,2016年全年共披露265985篇公告,2017年共披露291607篇,随着上市公司数量日益增多,这一数字也会逐年增加,不但为深交所的合规检查带来压力,也给投资者带来极大的信息负载。如何将海量公告更有效、更高效地让阅读人“读薄”?其中通过自然语言处理、深度学习等技术将公告信息结构化提取成为关键所在。

  庖丁科技透露,现正在持续而坚定地推进该项工作:首先通过卷积神经网络对公告中的段落表格等信息进行分割抽取。为了适应样本数量稀少的问题,他们还提出了一种轻量级的机器学习方法。该方法能够高效地将不同类别公告的关键语句抽取出来,并使之具有在线学习的能力,抽取过程仅需公告制作业务专家对少量公告进行标注,即可达到可用效果。关键语句抽取后,再通过LSTM神经网络进行细粒度提取, 十八腔视频,从而将公告结构化。目前,庖丁科技对并购重组公告的结构化抽取的工作已取得较为理想的结果,提升了深交所监管工作的效率。这项工作的探索不仅为扩展更多公告类型奠定基础,也为其他类型文本处理带来了宝贵经验。

  “利用非结构化信息抽取技术,我们能够把隐藏在海量公开公告中企业与企业、企业与个人关系进行深度挖掘,并且透视、洞察企业的价值及风险。作为国内拥有世界领先的金融文本信息抽取技术、有能力利用深度学习和金融知识库进行高精度的结构化信息提取的先进团体。”庖丁科技表示,未来将继续全力服务金融行业,助力金融机构进一步提升服务实体经济的能力。

特别声明:本文为城市头条城市号作者或机构上传并发布,仅代表该作者或机构观点,不代表城市头条的观点或立场,城市头条仅提供信息发布平台。
       版权声明:版权归著作权人,转载仅限于传递更多信息,如来源标注错误侵害了您的权利,请来邮件通知删除,一起成长谢谢
       欢迎加入:城市号,开启无限创作!一个敢纰漏真实事件,说真话的创作分享平台,一个原则:只要真实,不怕事大,有线索就报料吧!申请城市号请用电脑访问https://mp.chengshitoutiao.com。    

标签: 科技  
相关资讯
热门频道

热门标签

CopyRight 2016-2023 城市头条 ChengShiTouTiao.Com(城市头条有限公司) | 投稿/撤稿公邮:news@newsgo.com

城市头条网站所登载资讯、图集、视频等内容,版权归城市号自媒体平台原作者或投稿人所有,投稿视为本站原创首发,刊发或转载仅限传播目的非本网观点,未经授权请勿转载或商业用途。

特别声明:城市头条仅提供平台运营服务,不提供任何上传发布服务,城市头条网尊重知识产权保护,侵权反馈:fawu@newsgo.com 城市头条撤稿函下载 如有侵权请来邮告知,我们收到后会尽快处理答复。 Powered by EyouCms 备案号:吉ICP备2020008037号-11