基于C++开发的视频行为分析系统v4系统,可以在不用考虑音视频开发,编解码开发,界面开发等情况下, 只需要训练自己的模型,开发自己的算法插件,就可以轻松实现出任何想要的视频行为检测,比如周界入侵,烟火检测,打架,斗殴,跌倒,人群聚集,电动车,垃圾箱,抽烟,攀爬,离岗睡岗,安全帽,充电桩,工作服, 疲劳检测,交通拥堵等等。
最近更新: 2个月前Fay是一个完整开源的数字人应用框架,向下对接语言模型,向上对接数字人。通过三个版本的Fay(带货版、助理版、agent版)及数字人模型的组合,可轻松实现:卖场导购、虚拟主播、数字人助理、虚拟服务员、虚拟教师、语音助手、文字助手、移动助手。
最近更新: 3个月前本项目是一个基于百度飞桨PaddleSeg项目的人像分割模块而开发的.NET的工具类库。PaddleSeg是基于飞桨PaddlePaddle的端到端图像分割套件,内置45+模型算法及140+预训练模型,支持配置化驱动和API调用开发方式,打通数据标注、模型开发、训练、压缩、部署的全流程,提供语义分割、交互式分割、Matting、全景分割四大分割能力,助力算法在医疗、工业、遥感、娱乐等场景落地应用
最近更新: 3个月前OPT(Omni-Perception Pre-Trainer)是全场景感知预训练模型的简称,中文名字叫紫东太初,是中科院自动化和华为联合研发的多模态预训练模型,本仓是紫东太初十亿参数级别模型的MindSpore版本代码,包含预训练模型及多个下游任务模型。
最近更新: 3个月前MindSpore Transformers套件的目标是构建一个大模型训练、推理、部署的全流程套件: 提供业内主流的Transformer类预训练模型, 涵盖丰富的并行特性。 期望帮助用户轻松的实现大模型训练。 文档:https://gitee.com/link?target=https%3A%2F%2Fmindformers.readthedocs.io%2Fzh_CN%2Flatest
最近更新: 3个月前开源易用的中文离线OCR,识别率媲美大厂,并且提供了易用的web页面及web的接口,方便人类日常工作使用或者其他程序来调用~
最近更新: 3个月前运行于树莓派、Nanopi、OrangePi等开发板的智能语音控制程序。本程序基于百度语音识别、语音合成和图灵机器人。可通过程序控制语音控制家中电器设备。
最近更新: 3个月前