docs/zh_CN/ch4/Scriptis使用手册.md · Gitee 极速下载/Scriptis

1 功能简介

scirptis主要拆分为一下功能：

工作空间是一个文件目录，用户对该目录拥有所有的权限可以进行文件管理操作等。建议的目录结构是：script,data,log,res四个目录，目录结构清晰方便用户进行查看和管理。工作空间主要功能如下：

数据库模块主要有以下功能：

UDF功能是方便用户对UDF进行分类展示，以及用户可以对个人函数进行管理，共享等。主要包含以下功能：

默认顶层目录是：

平台函数：平台提供的UDF函数，可以在sql，pysaprk，scala，hive脚本的sql语言里面进行使用
系统函数：系统默认已经提供并自动加载了的函数，可以在sql，pysaprk，scala，hive脚本的sql语言里面进行使用
个人函数：个人自己新建立的UDF，包含通用函数，Spark专用函数。
共享函数：科室管理员建立的UDF函数，并共享给其他人使用除了系统函数外，其他类别的函数都必须点击加载后才能进行使用，而且点击勾选后一定要先kill掉已经启动的会话。另外勾选加载的UDF，在脚本中也会进行自动补全提示：

创建一个UDF很简单，主要在于做好前期的UDF代码的准备。步骤主要如下：

建立通用UDF，需要先编译好相应的Jar包。这里的通用是指Hive的hql和Spark的sql都可以用
建立Spark专用的UDF，需要先建立好相应的py脚本或者scala脚本，为了使用的正确性，最好测试下相应的脚本
在开发建立该UDF: 通用UDF：需要勾选通用，并选择对应的jar包路径，填写UDF的全类路径，填写使用格式和描述： Spark专用--scala脚本：需要勾选Spark，并选择对应的scala脚本，填写注册格式（填写相应脚本中的函数名）： Spark专用--Python脚本：需要勾选Spark，并选择对应的python脚本，填写注册格式（填写相应脚本中的函数名）：

PythonUDF建立方式，只需要定义一个方法即可，对应的脚本只能与该方法有关的内容：

def hello(id):
    return str(id)  +  ":hello"

ScalaUDF 建立方式和Python类似，定义一个方法即可：

def helloWorld(str:  String):  String  =  "hello, "  + str

注意：PythonUDF和ScalaUDF只能在Spark引擎对应的脚本中使用

方法模块和UDF模块功能类似，只是一个是UDF一个自定义函数。另外需要注意的是：python脚本定义的函数只能在python和pysaprk中使用，scala脚本定义的函数只能在scala中进行使用。

脚本模块就是脚本编辑框包含的功能，主要有：

运行结果包括以下功能：

表格结果展示，点击表头可以进行排序，双击复制字段名等，功能会继续丰富，包括选择列展示，展示字段类型。只支持展示5000行
可视化分析：点击可视化分析，可以通过VSBI对产生的结果集进行可视化展示（待开源）
下载：结果集支持直接下载到浏览器本地，支持CSV和excel，只支持下载5000行
导出：结果集导出可以支持导出到工作空间（BDAP的共享目录），结果集导出也支持CSV和Excel格式，并且通过打开全量导出，可以超过5000行的限制。全量导出开关，在执行的sql前面加上注释：--set wds.linkis.engine.no.limit.allow=true

脚本历史展示了该脚本文件的历史运行信息，可以快速找到之前运行的脚本的日志，结果。可以有效减少多次运行相同的脚本： ide23

管理台主要包含一下功能：

右下角弹出框点击后是类似于Windows的任务管理器类似的功能，用户可以快速的对任务管，引擎，队列资源进行查看和管理： ide24