luastring库字符串用法详解--688IT编程网

luastring库字符串⽤法详解

lua string库字符串⽤法详解

注:string库中所有的函数都不会直接修改原字符串，只返回新结果。

加[,]的参数指缺省，即可有可⽆,

string.len (s)

接收⼀个字符串，返回其长度。空串 “” 的长度为 0 。内嵌零也统计在内

string.len("abc") -- 返回:3

string.len("a\000bc\000") -- 返回:5

以上只⽀持英⽂,utf8 中⽂字符长度详情请见下⼀章”强⼤的匹配模式”

local _, count = string.gsub("中⽂utf8", "[^\128-\193]", "") -- count = 6

或lua⾃带的utf8⽀持(5.3版本)

utf8.len (s [, i [, j]])

返回字符串 s 中从位置 i 到 j 间（包括两端） UTF-8 字符的个数。默认的 i 为 1 ，默认的 j 为 -1 。如果它到任何不合法的字节序列，返回假值加上第⼀个不合法字节的位置。

string.byte (s [, i [, j]])

返回字符 s[i]， s[i+1]， …　，s[j] 的内部数字编码。 i 的默认值是 1 ； j 的默认值是 i。数字编码没有必要跨平台。

string.byte("abcABC", 1, 6) -- 返回:97 98 99 65 66 67

string.char (···)

接收零或更多的整数。返回和参数数量相同长度的字符串。其中每个字符的内部编码值等于对应的参数值。

string.char(97, 98, 99) -- 返回:abc

string.lower (s)

⼤写转⼩写

string.lower("ABc") -- 返回:abc

string.upper (s)

⼩写转⼤写

string.upper("ABc") -- 返回:ABC

返回 n 个字符串 s 以字符串 sep 为分割符连在⼀起的字符串。默认的 sep 值为空字符串（即没有分割符）。如果 n 不是正数则返回空串。

返回字符串 s 的翻转串。

string.sub (s, i [, j])

返回 s 的⼦串，该⼦串从 i 开始到 j 为⽌； i 和 j 都可以为负数。负数，取从字符串后⾯算起，如果开始位置在结束位置的后⾯，则返回空串

string.sub("abcABC", 1, -2) -- 返回:abcAB

string.sub("abcABC", -3) -- 返回:ABC

string.gsub (s, pattern, repl [, n])

将字符串 s 中，所有的（或是在 n 给出时的前 n 个） pattern 都替换成 repl ，并返回其副本。

repl 可以是字符串、表、或函数。

gsub 还会在第⼆个返回值返回⼀共发⽣了多少次匹配。

如果 repl 是⼀个字符串，那么把这个字符串作为替换品。字符 % 是⼀个转义符： repl 中的所有形式为 %d 的串表⽰第 d 个捕获到的⼦串，d 可以是 1 到 9 。串 %0 表⽰整个匹配。串 %% 表⽰单个 %。

如果 repl 是张表，每次匹配时都会⽤第⼀个捕获物作为键去查这张表。

如果 repl 是个函数，则在每次匹配发⽣时都会调⽤这个函数。所有捕获到的⼦串依次作为参数传⼊。

任何情况下，模板中没有设定捕获都看成是捕获整个模板。

如果表的查询结果或函数的返回结果是⼀个字符串或是个数字，都将其作为替换⽤串；⽽在返回 false 或 nil　时不作替换（即保留匹配前的原始串）。

string.gsub("hello1 world2", "(%a+)", "%1%1")

-- 理解:(%a+)会捕获到hello1中的hello，赋值给%1，此时"%1%1"即成了"hello hello",

-- 替换过去就成了"hello hello1"，后⾯字符同样理解，共匹配2次

-- 所以结果返回:hello hello1 world world2 2

-- 下⾯请⾃⾏理解，有益健康, 更多祥情，请看"强⼤的匹配模式"

1. string.gsub("hello world", "%w+", "%0%0", 1)

2. string.gsub("hello world", "%a+", "%0%0", 1)

3. string.gsub("hello world from Lua", "(%a+)%s*(%a+)", "%2%1")

4. string.gsub("4+5 = $return 4+5$", "%$(.-)%$", function (s) return load(s)() end)

local t = {name="lua", version="5.3"}

5. string.gsub("$name-$", "%$(%w+)", t)

string.find (s, pattern [, init [, plain]])

查第⼀个字符串 s 中匹配到的 pattern 。

如果到⼀个匹配，find 会返回 s 中关于它起始及终点位置的索引；否则，返回 nil。

第三个可选数字参数 init 指明从哪⾥开始搜索；默认值为 1 ，同时可以是负值。

第四个可选参数 plain为 true 时，关闭模式匹配机制。此时函数仅做直接的 “查⼦串”的操作，⽽ pattern 中没有字符被看作魔法字符。注意，如果给定了 plain　，就必须写上 init 。

如果在模式中定义了捕获，捕获到的若⼲值也会在两个索引之后返回。

string.find("8Abc%a23", "bc") -- 返回:3 4

string.find("8Abc%a23", "%a") -- 返回:2 2

string.find("8Abc%a23", "(%a)") -- 返回:2 2 A

string.find("8Abc%a23", "(%a)", 4) -- 返回:4 4 c

string.find("8Abc%a23", "%a", 1, true) -- 返回:5 6

string.match (s, pattern [, init])

在字符串 s 中到第⼀个能⽤ pattern 匹配到的部分。如果能到，match 返回其中的捕获物；

否则返回 nil 。

如果 pattern 中未指定捕获，返回整个 pattern 捕获到的串。

第三个可选数字参数 init 指明从哪⾥开始搜索；它默认为 1 且可以是负数。

string.match("abc123ABC456", "%a+%d+") -- 返回:abc123

string.match("abc123ABC456", "(%a+)%d+") -- 返回:abc

string.match("abc123ABC456", "(%a+)%d+", -5) -- 返回:BC

返回⼀个迭代器函数。

每次调⽤这个函数都会继续以 pattern 对 s 做匹配，并返回所有捕获到的值。

如果 pattern 中没有指定捕获，则每次捕获整个 pattern。

local s = "hello world from Lua"

for w atch(s, "%a+") do

print(w)

end

输出如下:

local t = {}

local s = "add=20, total=100"

for k, v atch(s, "(%w+)=(%d+)") do

t[k] = v

end

t表如下:c++string类型

string.format (formatstring, ···)

返回不定数量参数的格式化版本，格式化串为第⼀个参数（必须是⼀个字符串）。格式化字符串遵循

C 函数 sprintf 的规则。

不同点在于选项 *, h, L, l, n, p 不⽀持，另外还增加了⼀个选项 q

（注：可以⽤“..”连接字符串达到需要格式化后的字符串，“..”消耗较⼩）

常⽤转义符：

%s - 接受⼀个字符串并按照给定的参数格式化该字符串

%q - 接受⼀个字符串并将其转化为可安全被Lua编译器读⼊的格式

%d, %i - 接受⼀个数字并将其转化为有符号的整数格式(⼗进制数格式)

%u - 接受⼀个数字并将其转化为⽆符号整数格式

%f - 接受⼀个数字并将其转化为浮点数格式

%c - 接受⼀个数字，并将其转化为ASCII码表中对应的字符

%o - 接受⼀个数字并将其转化为⼋进制数格式

%x - 接受⼀个数字并将其转化为⼗六进制数格式，使⽤⼩写字母

%X - 接受⼀个数字并将其转化为⼗六进制数格式，使⽤⼤写字母

%e - 接受⼀个数字并将其转化为科学记数法格式，使⽤⼩写字母e

%E - 接受⼀个数字并将其转化为科学记数法格式，使⽤⼤写字母E

%g(%G) - 接受⼀个数字并将其转化为%e(%E，对应%G)及%f中较短的⼀种格式

为进⼀步细化格式, 可以在%号后添加参数. 参数将以如下的顺序读⼊:

1. 符号: +或- 默认情况下只有负数显⽰符号，可以加上+让正数显⽰+号

2. 占位符: 0, 即指定了字串宽度时，长度不⾜⽤0代补. 不填时的默认占位符是空格.

3. 对齐标识: 在指定了字串宽度时, 默认为右对齐, 增加-号可以改为左对齐.

4. 宽度数值

5. ⼩数位数/字串裁切: 在宽度数值后增加的⼩数部分n, 若后接f(浮点数转义符, 如%

6.3f)则设定该浮点数的⼩数只保留n位, 若后接s(字符串转义符, 如%5.3s)则设定该字符串只显⽰前n位.

在这些参数的后⾯则是上述所列的转义码类型(c, d, i, f, …)

-- 看起来东西好像不少，其实结合例⼦来看，花上⼏分钟即可

print(string.format("1:%04d-%02d-%02d", 2017, 01, 12))

print(string.format("2:%s%q", "Hello", "Lua!"))

print(string.format("3:%%c:%c", 97))

print(string.format("4:%+04d", 11.2))

print(string.format("5:%f/%0.2f/%.2f/%6.2f/%06.2f", 12, 12, 12, 12, 12))

print(string.format("6:%e, %E", math.pi, math.pi))

print(string.format("7:%d, %i, %u", -10, -10, -10))

print(string.format("8:%o, %x, %X", -10, -10, -10))

print(string.format("9:%c", 83))

print(string.format("10:%+04d", 11.2))

print("默认右对齐:\n" .. string.format("%6d\n%+06d\n%06d", 10, 20, 30))

print("改为左对齐:\n" .. string.format("%-6d\n%-+6d\n%-+06d", 10, 20, 30))

– 改为左对齐时，若⽤占位符0补位，格式化后显⽰的数字不付要求，故将0转为空格（本来+30，⽤0补位就成了+30000）

(以下⼏个没⽤过)

string.dump (function [, strip])

返回包含有以⼆进制⽅式表⽰的（⼀个⼆进制代码块）指定函数的字符串

string.packsize (fmt)

返回以指定格式⽤ string.pack 打包的字符串的长度。格式化字符串中不可以有变长选项 ‘s’ 或 ‘z’

string.unpack (fmt, s [, pos])

返回以格式 fmt 打包在字符串 s （参见 string.pack）中的值。选项 pos（默认为 1 ）标记了从 s 中哪⾥开始读起。读完所有的值后，函数返回 s 中第⼀个未读字节的位置。

688IT编程网

luastring库字符串用法详解

发表评论

推荐文章

随机森林算法介绍及R语言实现

基于随机森林优化的神经网络算法在冬小麦产量预测中的应用研究_百度文 ...

基于正则化贪心森林算法的情感分析方法研究

随机森林算法和grandientboosting算法

基于随机森林的图像分类算法研究

热门文章

随机森林特征选择原理

自动驾驶系统中的随机森林算法解析

随机森林算法及其在生物信息学中的应用

监督学习中的随机森林算法解析(六)

随机森林算法在数据分析中的应用

机器学习——随机森林,RandomForestClassifier参数含义详解

随机森林的算法

随机森林算法作用

监督学习中的随机森林算法解析(十)

随机森林算法案例

随机森林案例

二分类问题常用的模型

绘制ssd框架训练流程

一种基于信息熵和DTW的多维时间序列相似性度量算法

SVM训练过程范文

如何使用支持向量机进行股票预测与交易分析

二分类交叉熵损失函数binary

tinybert_训练中文文本分类模型_概述说明

基于门控可形变卷积和分层Transformer的图像修复模型及其应用

人工智能开发技术的测试和评估方法

最新文章

基于随机森林的数据分类算法改进

人工智能中的智能识别与分类技术

基于人工智能技术的随机森林算法在医疗数据挖掘中的应用

随机森林回归模型的建模步骤

r语言随机森林预测模型校准曲线

《2024年随机森林算法优化研究》范文

标签列表