代码拉取完成,页面将自动刷新
在flink 1.11中,内置提供了一个DataGen 连接器,主要是用于生成一些随机数,用于在没有数据源的时候,进行流任务的测试以及性能测试等。
使用时注意如下:
#2. 使用示例
bin/sql-client.sh embedded
或
bin/sql-client.sh embedded -l 依赖的jar包路径
CREATE TABLE datagen (
f_sequence INT,
f_random INT,
f_random_str STRING,
ts AS localtimestamp,
WATERMARK FOR ts AS ts
) WITH (
'connector' = 'datagen',
-- optional options --
'rows-per-second'='5',
'fields.f_sequence.kind'='sequence',
'fields.f_sequence.start'='1',
'fields.f_sequence.end'='1000',
'fields.f_random.min'='1',
'fields.f_random.max'='1000',
'fields.f_random_str.length'='10'
);
select * from datagen;
DDL的with属性中,除了connector是必填之外,其他都是可选的。 rows-per-second 每秒生成的数据条数 f_sequence字段的生成策略是按序列生成,并且指定了起始值,所以该程序将会在到达序列的结束值之后退出 f_random 字段是按照随机生成,并指定随机生成的范围 f_random_str是一个字符串类型,属性中指定了随机生成字符串的长度是10 ts列是一个计算列,返回当前的时间.
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。