最新发布第6页
排序
一种针对文字识别的多模态半监督方法
【摘要】本文提出了一种针对文字识别的多模态半监督方法,具体来说,作者首先使用teacher-student网络进行半监督学习,然后在视觉、语义以及视觉和语义的融合特征上,都进行了一致性约束。 摘要...
LayoutXLM: 面向多语种视觉丰富文档理解的多模态预训练模型
1 引言 目前,针对视觉丰富文档(Visually-rich Document, VrRD)的多模态预训练模型已经在多个文档理解任务上取得了领先的结果,例如表格/票据理解、复杂版面分析、文档图像分类以及文档视...
LayoutLMv2: 面向视觉丰富文档理解的多模态预训练
1. 引言 LayoutLMv2 [1] 是LayoutLM [2] 的后续改进版本,不熟悉的读者可以参考笔者的上一篇博文[3]。LayoutLM进行文本、版面的预训练,只在下游任务加入图像特征,而LayoutLMv2进一步将...
华为云 & 曹操出行,战略合作签约!
曹操出行CEO龚昕,华为高级副总裁、华为云CEO张平安等嘉宾出席仪式。 曹操出行创立于2015年,是吉利控股集团布局“新能源汽车共享生态”的战略性投资业务,以“科技重塑绿色共享出行”为使命,...
还担心接口乱糟糟?快来试试“斯瓦格”在线文档管理平台!【开发者专属集市】
在开发过程中,前后端最糟心的事就是沟通接口,在此过程中,吵得最凶的根源就在于接口文档的不完善、乱、难于使用,甚至都没有统一管理接口的地方。本文将分享一款在线接口文档管理工具:“斯瓦...
跟着华为云ModelArts,一键上手时下最火AI作画工具
AI作画为什么最近特别火,AI作画现在已经进化到什么程度了? 你相信下面的画作是AI作画吗? 前段时间,在美国科罗拉多州的一个博览会上,有人用下面这幅名为《空间歌剧院》的作品拿到了博览会数...
【云小课】EI第49课 Modelarts遇上ModelBox框架,高效助力AI应用开发
AI应用开发是指将训练好的一个或多个模型编排开发成推理应用以满足具体业务场景下的推理需求,比如视频质量检测、交通拥堵诊断等。AI应用开发在整个AI开发流程的位置大致如图所示。 通常为了降...
【每日一读】On Interpretation of Network Embedding via Taxonomy Induct
@TOC 简介 Hello! 非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出~ ଘ(੭ˊᵕˋ)੭ 昵称:海轰 标签:程序猿|C++选手|学生 简介:因C语言结识编程,随后转入计算机专...
【JVM】关于JVM,你需要掌握这些 | 一文彻底吃透JVM系列
写在前面 最近,一直有小伙伴让我整理下关于JVM的知识,经过十几天的收集与整理,初版算是整理出来了。希望对大家有所帮助。 JDK 是什么? JDK 是用于支持 Java 程序开发的最小环境。 Java 程序...