Функции разбиения и слияния строк и массивов
splitByChar(separator, s)
Разбивает строку на подстроки, используя в качестве разделителя separator.
separator должен быть константной строкой из ровно одного символа.
Возвращается массив выделенных подстрок. Могут выделяться пустые подстроки, если разделитель идёт в начале или в конце строки, или если идёт более одного разделителя подряд.
Синтаксис
Аргументы
Возвращаемые значения
Возвращает массив подстрок. Пустая подстрока, может быть возвращена, когда:
- Разделитель находится в начале или конце строки;
- Задано несколько последовательных разделителей;
- Исходная строка
sпуста.
Пример
splitByString(separator, s)
Разбивает строку на подстроки, разделенные строкой. В качестве разделителя использует константную строку separator, которая может состоять из нескольких символов. Если строка separator пуста, то функция разделит строку s на массив из символов.
Синтаксис
Аргументы
Возвращаемые значения
Возвращает массив подстрок. Пустая подстрока, может быть возвращена, когда:
- Разделитель находится в начале или конце строки;
- Задано несколько последовательных разделителей;
- Исходная строка
sпуста.
Примеры
splitByRegexp(regexp, s)
Разбивает строку на подстроки, разделенные регулярным выражением. В качестве разделителя используется строка регулярного выражения regexp. Если regexp пустая, функция разделит строку s на массив одиночных символов. Если для регулярного выражения совпадения не найдено, строка s не будет разбита.
Синтаксис
Аргументы
regexp— регулярное выражение. Константа. String или FixedString.s— разбиваемая строка. String.
Возвращаемые значения
Возвращает массив выбранных подстрок. Пустая подстрока может быть возвращена, если:
- Непустое совпадение с регулярным выражением происходит в начале или конце строки;
- Имеется несколько последовательных совпадений c непустым регулярным выражением;
- Исходная строка
sпуста, а регулярное выражение не пустое.
Примеры
Запрос:
Результат:
Запрос:
Результат:
splitByWhitespace(s)
Разбивает строку на подстроки, используя в качестве разделителей пробельные символы.
Синтаксис
Аргументы
s— разбиваемая строка. String.
Возвращаемые значения
Возвращает массив подстрок.
Пример
splitByNonAlpha(s)
Разбивает строку на подстроки, используя в качестве разделителей пробельные символы и символы пунктуации.
Синтаксис
Аргументы
s— разбиваемая строка. String.
Возвращаемые значения
Возвращает массив подстрок.
Пример
arrayStringConcat(arr[, separator])
Склеивает строковые представления элементов массива с разделителем separator.
separator - необязательный параметр, константная строка, по умолчанию равен пустой строке.
Возвращается строка.
alphaTokens(s)
Выделяет подстроки из подряд идущих байт из диапазонов a-z и A-Z. Возвращается массив выделенных подстрок.
Пример:
ngrams
Выделяет из UTF-8 строки отрезки (n-граммы) размером ngramsize символов.
Синтаксис
Аргументы
string— строка. String or FixedString.ngramsize— размер n-грамм. UInt.
Возвращаемые значения
- Массив с n-граммами.
Пример
Запрос:
Результат:
tokens
Разбивает строку на токены, используя в качестве разделителей не буквенно-цифровые символы ASCII.
Аргументы
input_string— набор байтов. String.
Возвращаемые значения
Возвращает массив токенов.
Тип: Array.
Пример
Запрос:
Результат: