🔥 Apache DolphinScheduler是一个新一代分布式大数据工作流任务调度系统,致力于“解决大数据任务之间错综复杂的依赖关系,整个数据处理开箱即用”。它以 DAG(有向无环图) 的方式将任务连接起来,可实时监控任务的运行状态,同时支持重试、从指定节点恢复失败、暂停及 Kill任务等操作。目前已经有像IBM、腾讯、美团、360等400多家公司生产上使用,下载安装包请去官网
🔥 Apache DolphinScheduler是一个新一代分布式大数据工作流任务调度系统,致力于“解决大数据任务之间错综复杂的依赖关系,整个数据处理开箱即用”。它以 DAG(有向无环图) 的方式将任务连接起来,可实时监控任务的运行状态,同时支持重试、从指定节点恢复失败、暂停及 Kill任务等操作。目前已经有像IBM、腾讯、美团、360等400多家公司生产上使用,下载安装包请去官网
如果你在从事大数据BI的工作,想对比一下MySQL、GreenPlum、Elasticsearch、Hive、Spark SQL、Presto、Impala、Drill、HAWQ、Druid、Pinot、Kylin、ClickHouse、Kudu等不同实现方案之间的表现,那你就需要一份标准的数据进行测试,这个开源项目就是为了生成这样的标准数据。本站是data-generator在Github的镜像站点,仅做备份使用。 https://github.com/ysc/data-generator
此项目是自己在学习Hadoop知识练习的一些小案例的汇总。 主要涉及HDFS的JAVA API操作和MapReduce重要知识点的小练习,包括利用HDFS JAVA API实现读取HDFS中文件、写入数据到HDFS中、删除HDFS中数据、查询HSFS中文件元数据、列出HDFS中文件详细信息等相关的操作,MapReduce程序实现的汇总、求平均数、Jion操作、TopK算法、二次排序、以及自定义InputFormat、OutputFormat和shuflle阶段的一些应用如(自定义Partitioner、合并小文件、MutilpleOutPuts自定义输出等等)。 每个案例都以不同的包区分。 详细说明见Readme.md文件
Python Kerberos 管理员模块,通过python管理Kerberos KDC账号,支持账号添加,删除,修改以及导出keytab文件,原作 https://github.com/rjancewicz/python-kadmin
MUI-Module User Interface,which is built by module and could be loaded on need。
最近一年贡献:0 次
最长连续贡献:0 日
最近连续贡献:0 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。