Appearance
表达式说明
表达式列表说明
引言
下面讲解在使用计算字段时,表达式列表的相关说明。
聚合函数
此表达式列表通过对多个值进行汇总,将其合并为单个值,从而实现数据的概括。这对于提供洞察和简化分析非常有用。
平均值 (Average)
定义: 返回列中值的平均数。
表达式语法: avg(column)
结果数据类型: double
举例: 假设某商品价格分别为 100, 200, 300,那么:avg(price) = 200.0
计数 (Count)
定义: 返回所选数据中非空行(也称为记录)的数量。
表达式语法: count(column)
结果数据类型: bigint
举例: 假设有 5 条有效销售记录,那么:count(sales_id) = 5
最大值 (Max)
定义: 返回列中找到的最大值。
表达式语法: max(column)
结果数据类型: [与输入相同]
举例: 假设价格列有值 100, 200, 150,那么:max(price) = 200
最小值 (Min)
定义: 返回列中找到的最小值。
表达式语法: min(column)
结果数据类型: [与输入相同]
举例: 假设价格列有值 100, 200, 150,那么:min(price) = 100
求和 (Sum)
定义: 将列中的所有值相加。
表达式语法: sum(column)
结果数据类型: [与输入相同]
举例: 假设价格列有值 100, 200, 150,那么:sum(price) = 450
数学函数
以下表达式用于转换、操作或汇总数值数据,以提取洞察信息并识别模式,从而辅助决策。
绝对值 (Absolute)
定义: 返回指定列的绝对值(正值)。
表达式语法: abs(column)
结果数据类型: [与输入相同]
举例: 假设计算字段 a = -154.85,那么:abs(a) = 154.85 。如果 a = 154.85,其绝对值仍为:abs(a) = 154.85 。
立方根 (Cube Root)
定义: 返回数字的立方根。
表达式语法: cbrt(column)
结果数据类型: double
举例: 假设字段 a = 27,那么:cbrt(a) = 3.0
向上取整 (Ceil)
定义: 将小数向上取整(ceil 表示天花板)。
表达式语法: ceil(column)
结果数据类型: [与输入相同]
举例: 假设字段 a = 3.2,那么:ceil(a) = 4
指数 (Exponential)
定义: 返回欧拉数 e 的指定次幂。
表达式语法: exp(column)
结果数据类型: double
举例: 假设字段 a = 1,那么:exp(a) = 2.71828...
向下取整 (Floor)
定义: 将小数向下取整。
表达式语法: floor(column)
结果数据类型: [与输入相同]
举例: 假设字段 a = 3.8,那么:floor(a) = 3
自然对数 (Ln)
定义: 返回数字的自然对数。
表达式语法: ln(column)
结果数据类型: double
举例: 假设字段 a = 2.71828,那么:ln(a) ≈ 1.0
常用对数 (Log10)
定义: 返回数字的以 10 为底的对数。
表达式语法: log10(column)
结果数据类型: double
举例: 假设字段 a = 1000,那么:log10(a) = 3.0
四舍五入 (Round)
定义: 将小数四舍五入到最接近的整数值。
表达式语法: round(column)
结果数据类型: [与输入相同]
举例: 假设字段 a = 3.6,那么:round(a) = 4
符号函数 (Signum)
定义: 返回数字的符号函数值(正数返回 1,负数返回 -1,零返回 0)。
表达式语法: sign(column)
结果数据类型: [与输入相同]
举例: 假设字段 a = -5,那么:sign(a) = -1。如果 a = 0,那么:sign(a) = 0
字符串函数
以下表达式用于处理字符串数据,能够高效地操作和分析文本值。
长度 (Length)
定义: 返回字符串中的字符数。
表达式语法: length(column)
结果数据类型: bigint
举例: 假设字段 name = 'Hello',那么:length(name) = 5
反转 (Reverse)
定义: 返回一个字符顺序颠倒的字符串。
表达式语法: reverse(column)
结果数据类型: varbinary
举例: 假设字段 name = 'hello',那么:reverse(name) = 'olleh'
数据类型简介
以下表格展示了常用的数据类型的示例、定义以及典型用例。
数据类型 | 定义 | 示例 |
---|---|---|
BOOLEAN | 存储逻辑上的“真”或“假”数据 | True, False |
BIGINT | 存储较大的整数值,通常支持 64 位 | 9223372036854775807, -10000000000 |
DOUBLE | 存储双精度浮点数 | 3.14159, -0.00001 |
INT | 存储不带小数部分的整数 | -5, 0, 123 |
FLOAT | 存储带小数部分的数字 | -87.5, 0.0, 3.14159 |
DATE | 存储不包含时间信息的日历日期 | 2024-08-26 |
TIMESTAMP | 存储高精度的日期和时间信息(精确到秒) | 2024-08-26 14:23:05 |
STRING | 存储字符序列或文本 | Hello World, 12345, Blue |
VARCHAR | 存储可变长度的字符字符串 | User123, ProductABC, Company098 |