分类
波胆赔率网

飞桨端到端开发套件揭秘低成本开发的四大秘密武器

11月5日,在Wave Summit+2019深度学习开发者峰会上,飞桨全新发布和重要升级了最新的21项进展,在深度学习开发者社区引起了巨大的反响。

很多未到场的开发者觉得遗憾,希望可以了解飞桨发布会背后的更多技术细节,因此我们特别策划了一个系列稿件,分别从核心框架、基础模型库、端到端开发套件、工具组件和服务平台五个层面分别详细解读飞桨的核心技术与最新进展,敬请关注。

今年,安巴尼旗下信实工业集团的股价上涨了40%,涨幅是印度基准股指BSE Sensex指数的两倍以上,从而推动了他的财富激增。

王鸿津对加强巡视整改提出明确要求,强调中央和国家机关是推动党和国家各项事业发展的领导机关,在党和国家治理体系中处于特殊重要位置,中国作协党组要切实提高政治站位,坚持党的领导,加强政治建设,坚持用习近平新时代中国特色社会主义思想武装头脑、指导实践、推动工作,增强“四个意识”,坚定“四个自信”,做到“两个维护”。要强化政治担当,践行初心使命,积极适应新形势新任务新要求,自觉站在党和国家事业全局高度谋划本单位、本系统工作,结合职能职责把党的路线方针政策和党中央重大决策部署落到实处。坚决落实全面从严治党“两个责任”,建立健全权力监督制约机制,持续整治形式主义、官僚主义,推动中央单位全面从严治党向纵深发展。要从政治高度抓好巡视整改和成果运用,贯彻落实十九届四中全会和中央经济工作会议精神,把巡视整改与巩固拓展“不忘初心、牢记使命”主题教育成果结合起来,与深化改革发展结合起来,与强化日常监督结合起来。领导班子对巡视整改负总责,党组书记必须自觉担负起整改第一责任人责任,坚持从本级、本人改起,一体推进巡视新发现问题、“不忘初心、牢记使命”主题教育检视问题和上次巡视整改不到位问题的整改,建立健全整改长效机制,完善内部治理体系,提高治理能力和治理水平,推动中国作协各项工作高质量发展。纪检监察机关和组织部门要加强巡视整改日常监督,对敷衍整改、虚假整改的严肃问责。

特色4:向量服务器,支持跨平台灵活部署

本次发布还进一步增强了YOLOv3,基于COCO的mAP再进一步提升至41.4%,GPU上的推理速度进一步提升。本次还发布了BlazeFace等系列人脸检测模型,同时还发布了自研的搜索版本BlazeFace,模型大小压缩三倍的情况下,大幅提升预测速度。特别强调一下,预训练模型中的行人检测和车辆检测的模型,是基于百度内部的业务数据得到效果不错的模型,值得推荐。

吴玉章说,“蛋白质抗原工程技术”目前已应用于历次重大疫情防控,获医疗器械注册证书和欧盟CE证书7件,全球销售2600多万人份。(完)

ERNIE 2.0拥有强大的语义理解能力,而这些能力需要强大的算力才能充分发挥,这为实际应用带来了非常大的挑战。为此,百度发布轻量级预训练模型ERNIE Tiny以及一键式数据蒸馏工具ERNIE Slim,预测速度提升达到1000倍。

记者获悉,该项目发明了在表位水平上对病毒的“快拆”新技术,具有廉价、快捷、高分辨率等特点,应用于流感、登革热、SARS等重大疫情防控。团队建立的国际最大病毒表位数据库(EDC)和国际首个抗原超型数据库(HLAsupE),可实现病毒在表位水平的快速拆解,将表位拆解分辨率提升到单个氨基酸残基水平,使描绘某个病毒表位图谱的时间由过去的数年缩短为数周,提高了研究效率、节约了研究成本。

今天给大家带来的是系列文章之飞桨的端到端开发套件解读。

今年7月份,百度发布持续学习语义理解框架ERNIE 2.0,在共计16个中英文任务上超越BERT、XLNET,取得了SOTA的效果。同时ERNIE 2.0发布以来,ERNIE产业化应用进程不断加速,易用性不断提升,配套产品也不断丰富和完善。目前ERNIE 2.0在百度内部及行业内已取得了广泛应用,在多种场景下都取得了明显效果提升。这些场景的成功运用为ERNIE产业化应用积累了丰富的经验。

根据产业的需求,PaddleSeg开发了高性能的C++预测库。在多线程计算优化、算子硬件加速方面,而且依托于真实的项目实践验证做了大量优化工作,真正满足工业级部署需求。

备豫不虞,为国常道。翻开历史可以看到,对抗鼠疫、天花、疟疾、肺结核以至流感,都少不了科学的指引、科研工作者的努力。如今,我国把新冠肺炎防控科研攻关作为一项重大而紧迫任务,采取全面、严格、彻底的防控举措,综合多学科力量,统一领导、协同推进。在坚持科学性、确保安全性的基础上加快研发进度,尽快攻克疫情防控的重点难点问题,我们抗疫之战必将取得最终胜利。(高延)

ElasticCTR个性化预估,是工业推荐场景下的常见需求,与工业实践的关联度非常高。以飞桨核心框架为核心,ElasticCTR实现了大量的技术突破:通过与资源调度平台深度集成提高资源调度的效率;在分布式训练的环节,提供全异步的参数服务器方案、流式训练和高性能的IO接口;最终,通过高性能的KV预估和一键部署工具实现工业级部署。

飞桨全新发布包含语义理解(ERNIE),目标检测(PaddleDetection),图像分割(PaddleSeg)和点击率预估(ElasticCTR)四大端到端开发套件,旨在通过模块化的设计和端到端的体验,满足企业低成本开发和快速集成需求。核心内容3503字,预计阅读时间4分钟。

端到端开发套件具有以下三个通用特点:一是满足真正的工业场景中性能要求,保持性能领先;二是开发简单易用,高效解决问题;三是打通端到端流程,落地高效易部署。

1.端到端开发套件的初心

ERNIE Fine-tune微调工具旨在为给开发者提供一套简单好用的Fine-tune框架,目前覆盖NLP四大常用任务:单句分类、句对匹配、命名实体识别、阅读理解。工具集支持多机多卡Fine-tune,同时使用FP16 Tensor Core技术在Tesla V系列GPU上获得60%的训练速度提升。

飞桨发布端到端开发套件的初心,是为了更好满足开发者的低开发成本、快速集成需求而来的。开发者的时间、人力非常宝贵,效率提升非常重要。为了要解放开发者劳动力,降低开发的成本,同时能够快速的集成和部署,飞桨推出了端到端开发套件。

PaddleDetection在训练速度、训练显存和推理速度上,大部分模型都优于对标产品的性能。

特色3:极速预测API

吴玉章介绍说,针对新突发病原对公众健康和国防安全的严重威胁,该团队发明了在表位水平对蛋白质抗原的“快拆”“可改”“能装”等关键技术,获海内外授权专利34件、计算机软件著作权2件,目前已在海内外68家单位推广。

此外,套件还包含了ERNIE的平台化使用方案,开发者可通过EasyDL专业版一站式完成NLP任务的数据标注、处理、ERNIE微调、优化、部署等全流程的功能,为开发者提供丰富的算法、算力服务,进一步降低ERNIE的产业化应用门槛。平台预置了常用的NLP文本分类、文本匹配等经典网络,能够快速满足多层次开发者的需求。

PaddleSeg在性能优化方面开展了很多工作。包括训练速度提升、GPU利用率提升以及显存性能优化。同时支持较新的FP16混合精度的训练。特别的,对于动态的Loss Scaling,在不损失精度的情况下,性能可以有30%的提升。PaddleSeg在英伟达特斯拉V100卡上,单卡训练速度是对标产品的2.3倍,多卡上是对标产品的3.1倍。

PaddleSeg提供10余种数据增强的策略,有效的训练数据,大幅度提升模型的鲁棒性,开发者可以根据实际的场景进行灵活组合,根据实际场景进行选用,让整个分割模型应用泛化能力更强。

整个PaddleSeg开发套件都是模块化设计的,无论是数据增强模块里面的多种增强算法,主干网络的多种Backbone模块选择,都可以让开发者更好的根据实际业务场景需求使用。分割网络包含了目前的4种主流网络:医疗领域常见的U-Net,经典的DeepLabV3,面向实时场景的分割模型ICNet等。同时对于损失函数的模块化设计,也可以更好的提升各个分类场景下的分割精度,例如小目标分割的效果。

此外,该团队2002年在国际上率先制造出模拟病毒(英文译名mimovirus),2010年率先制造出模拟逆转录病毒(英文译名mimoretrovirus),为应对生物恐怖病原和国防安全形成前瞻性技术储备。

近日,习近平总书记在北京考察新冠肺炎防控科研攻关工作,代表党中央向奋斗在疫情防控科研攻关一线的广大科技工作者表示衷心的感谢和诚挚的问候。总书记强调,人类同疾病较量最有力的武器就是科学技术,人类战胜大灾大疫离不开科学发展和技术创新。自新冠肺炎疫情发生以来,总书记多次强调战胜疫病离不开科技支撑,要求加快治疗药品和疫苗研发,这令人们在应对这场战“疫”时更添底气。

特色2:模块化的设计

PaddleDetection是基于飞桨核心框架,结合百度科研和业务的需求,构建的目标检测开发套件。从全景图可以看到,套件中主要不仅包含各个检测算法实现,而且提供一系列的优化组件,以及更好的辅助调试的可视化的模块。同时,还提供了加速训练相关的混合精度的训练模块以及丰富的算法组件。

王荣军提出了五点整改意见建议:一是切实加强政治建设。深入学习贯彻习近平新时代中国特色社会主义思想和党的十九大以及十九届二中、三中、四中全会精神,增强“四个意识”、坚定“四个自信”、做到“两个维护”。坚定不移把党的领导落实到工作全过程,坚持“二为”方向、贯彻“双百”方针,增强政治引领力和感召力,团结引导广大作家和文学工作者始终听党话、跟党走。二是认真履行党中央赋予的职责使命。不断增强政治性、先进性、群众性,积极主动适应新形势新任务新要求,健全联系、服务、管理和引导作家长效机制,加强对网络作家等新文学群体的团结引导,在去机关化、行政化上下功夫;落实意识形态工作责任制,加强阵地建设和管理。三是压实全面从严治党“两个责任”。增强管党治党责任意识,有效传导压力,加强廉洁风险防控和制度建设,坚决整治形式主义、官僚主义问题。四是深入贯彻落实新时代党的组织路线。切实加强班子自身建设,严格执行干部选拔任用制度规定,强化对干部的日常管理监督,压实党建工作责任,发挥基层党组织战斗堡垒作用。五是认真落实巡视整改主体责任,一体推进巡视和“不忘初心、牢记使命”主题教育检视问题的整改,举一反三、建章立制,做到真改实改、全面整改。

ERNIE Fast-inference API旨在解决产品应用的延迟敏感场景,为企业开发者提供极速预测的C++ API,便于开发者集成。该工具也充分借助了最新版飞桨的高速预测优势,飞桨1.6通过OP聚合算法,有效加速了ERNIE的预测。

钱小芊表示,中央巡视反馈的意见直指问题、切中要害。对巡视反馈的问题,我们诚恳接受,照单全收。中国作协党组将认真贯彻落实习近平总书记关于巡视工作的重要讲话精神,以高度的政治自觉,以善作善成的务实举措,坚决有力、不折不扣地抓好巡视整改落实。一是聚焦“两个维护”,进一步提高政治站位、增强政治定力、强化政治担当,端正态度,摆正位置,严肃认真地看待中央巡视组反馈的问题,严肃认真地开展批评与自我批评,严肃认真地担负起巡视整改责任,做到问题不解决不松劲、解决不彻底不放手、群众不认可不罢休,坚决将巡视整改要求落实落地。二是聚焦整改效能,把巡视整改与贯彻落实党中央关于推进国家治理体系和治理能力现代化的决策部署结合起来,与深化作协改革结合起来,夯实责任抓整改、凝神聚力抓整改、严督实查抓整改、标本兼治抓整改,着力解决影响制约文学事业、作协工作发展的突出问题。三是聚焦职责使命,把巡视整改成果向抓好主责主业拓展、向服务基层延伸、向推动文学创作转化,切实将坚持党的领导、加强党的建设、全面从严治党和增强政治性先进性群众性的要求贯彻到文学事业、作协工作全过程各方面。

ERNIE全景图,预置了包含ERNIE通用模型、ERNIE任务模型、ERNIE领域模型以及本次发布的ERNIE Tiny轻量级模型等系列预训练模型。在此基础上,构建了包含工具和平台的飞桨语义理解开发套件。全面覆盖了训练、调优、部署等开发流程,具备轻量方案、能力全面、极速预测、部署灵活、平台赋能等五大特色。

PaddleDetection基于飞桨高性能的引擎,提供了一套完备的部署方案。对于Linux和Windows都提供了良好的支持,GPU预测底层支持TensorRT加速以及FP16预测。CPU底层支持使用MKLDNN加速。再加上PaddleSlim提供的模型压缩策略,可以提供更小的模型和更快的速度,满足工业级部署的需求。

ElasticCTR源自真实产业实践,与原生K8S无缝结合,通过针对深度学习任务进行弹性调度的处理,可以大幅节约资源消耗。性能方面,全异步分布式CPU训练速度是对标产品的6倍,工业级部署性能是对标产品的13倍,非常适合大规模CTR的应用场景。

相比之下,阿里巴巴创始人马云的净身价今年增加了113亿美元,而全球首富、亚马逊创始人贝佐斯由于离婚时向前妻转让了大量股份,身价缩水了132亿美元。

综合来看,ERNIE的语义理解开发套件依托百度在预训练模型等自然语言处理技术和飞桨平台领先优势,为人工智能产业化大生产贡献力量,赋能各行各业。

对于端到端体验的流程中,数据处理也是非常重要的环节,飞桨通过扎实打通端到端流程,模块和的设计,提供一系列的工具箱辅助开发者去解决。目前发布的四大端到端开发套件,非常具有典型性,可以覆盖主流一大部分任务。

PaddleSeg目前已经在广泛场景中应用,无论是工业质检中的精密零件的智能分拣,以及经典的人像分割场景的应用,还有遥感领域的地块分割,都可以很好的辅助完成行业的AI赋能。

PaddleDetection目前已经广泛的在智慧交通、安防监控和商品检索上实现落地引用,并且取得了良好的应用效果。

在计算机视觉领域,图像分割有非常广泛应用的场景。基于这样背景,飞桨开发了图像分割开发套件PaddleSeg,目标是降低开发门槛,更容易实现产业落地。图像分割开发套件基于飞桨的核心框架,主要做了以下方向的建设:一是数据增强,将工业级常用分割算法开放出来;二是在模型层使用模块化的设计,将整个分割的模型拆分成三块,包括骨干网络、分割网络和模型损失函数。拆解之后,可以让这些模块自由组合,能够解决特定场景的问题。三是在训练场景上,PaddleSeg里面做了大量性能方面的优化,在显存优化和预测速度上都做了大量的工作。四是易用性方面,通过实际的项目打磨验证,找到使用过程当中的痛点并且解决掉。训练模型工业级部署,开发套件也做了集成,可以帮助广泛开发者使用。

特色2:一键式高性能全类微调工具

在算法层面,PaddleDetection支持了目前常用的主流检测算法,单阶段检测算法包括:SSD,RetinaNet,YOLOv3,两阶段检测算法包括:Faster-RCNN,Mask-RCNN,Cascade-RCNN,支持两阶段的FPN。在主干网、数据增强、在预训练模型方面,都提供了很好的支持。

疫情防控形势积极向好,离不开坚持向科学要答案、要方法。广大科研人员夜以继日、辛勤付出,做了大量工作,攻关了一项项科研成果。在较短时间内分离出新型冠状病毒并找到病原体,研制出核酸检测试剂盒,筛选出临床有效的中药西药和诊疗方法,积极主动与国际社会开展交流合作……他们取得了一系列振奋人心的成果,牵动人心、急迫期待。用好科技这把抗疫“利器”,发挥好拼搏奉献的优良作风、严谨求实的专业精神,给广大患者注入信心和希望,也能更进一步掌握与病毒较量的主动权。

特色1:轻量级解决方案,预测速度提升1000倍

特色1:丰富的数据增强

根据党中央统一部署,2019年9月至11月,中央第六巡视组对中国作协党组进行了常规巡视。巡视组坚持以习近平新时代中国特色社会主义思想为指导,全面贯彻巡视工作方针,坚守政治巡视定位,把“两个维护”作为根本任务,围绕中心、服务大局,紧扣职责使命强化政治监督,重点检查落实党的路线方针政策和党中央重大决策部署、全面从严治党战略部署、新时代党的组织路线以及巡视整改等情况,推动中央和国家机关加强政治建设,带头做到“两个维护”、践行“三个表率”、建设模范机关,推进党和国家治理体系和治理能力现代化。中央巡视工作领导小组听取了巡视组的巡视情况汇报,并向中央政治局常委会会议报告了有关情况。

王荣军在反馈时指出,中国作协党组坚持以习近平新时代中国特色社会主义思想为指导,贯彻落实党的文艺方针政策,推进党的建设和管党治党,为文学事业发展作出了努力。巡视也发现了一些问题,主要是:学习贯彻习近平总书记关于文艺工作和群团工作重要论述还不深入,保持和增强政治性、先进性、群众性不够,引领广大作家书写和记录伟大事业、时代精神措施不够有力,引导广大作家坚持“二为”方向存在不足,推动文学事业繁荣发展有差距;意识形态工作责任未层层压实,阵地建设和管理不到位;机关化、行政化问题仍然存在,联系服务广大作家和文学工作者不够积极主动,团结引领网络作家不够;落实全面从严治党战略部署不够严实,压力传导层层递减,一些党员领导干部纪律规矩意识淡薄,纪检监察机构履行监督职责不够到位,个别领域廉洁风险比较突出,形式主义、官僚主义问题仍然存在;干部队伍建设和选人用人存在薄弱环节,对基层党建重视不够;对巡视、审计指出的问题整改不到位。同时,巡视组还收到反映一些领导干部的问题线索,已按有关规定转中央纪委国家监委、中央组织部等有关方面处理。

为进一步降低开发者使用成本,套件提供预测服务方案——ERNIE Service,来方便获取ERNIE模型的向量分布以及预测打分。

提高治愈率、降低病亡率关键靠科技,同时我们也必须看到,科研攻关绝非一时之功。实验室里争分夺秒,疫苗研发进程的每一个环节备受瞩目,但是攻关新型检测试剂、抗体药物、疫苗和诊疗方案需要一个过程,查病源、堵源头也需要时间。搞清新冠肺炎病毒从哪里来、向哪里去,掌握病毒的特性等方方面面的规律,积极营造鼓励大胆创新、勇于创新、包容创新的良好氛围,“两条战线”相互配合、并肩作战,全国上下万众一心、众志成城,更有针对性地做好防疫工作。坚持在疫情可溯、可诊、可防、可治、可控方面合力攻关,掌握更多具有自主知识产权的核心科技,拿出更多硬核产品,才能守护人民生命安全、维护国家战略安全。

中央第六巡视组副组长及有关同志,中央巡视工作领导小组办公室、中央纪委国家监委有关监督检查室、中央组织部有关局负责同志,中央纪委国家监委驻中宣部纪检监察组有关负责同志,中国作协党组领导班子成员出席会议;中国作协有关部门、单位负责同志列席会议。

2.四大开发套件详细解读