Настройки на филтъра за CSV

The CSV filter accepts an option string containing five to fifteen tokens, separated by commas. Tokens 6 to 15 are optional.

Пример:

Импортиране от UTF-8, немски език, разделител запетая, текстовете оградени с ", полета в кавички като текст. CSV файлът има колони, форматирани като дата, число, число, число:

soffice --infilter="Text - txt - csv (StarCalc):44,34,76,1,1/5/2/1/3/1/4/1,1031,true,true" test.csv

Експортиране към Windows-1252, разделител на полетата: запетая, разделител на текста: кавичка, записване съдържанието на клетките както се вижда:

soffice --convert-to "csv:Text - txt - csv (StarCalc):44,34,ANSI,1,,0,false,true,true" --outdir=/home/user test.ods

Позиция на кода

Дефиниция

Значение и пример за кода

1

Разделител за поле

Разделител(и) на полетата като стойности от ASCII. Ако стойностите са няколко, се разделят с наклонена черта („/“), т.е. ако стойностите са разделени с точки и запетаи и хоризонтални знаци за табулация, кодът ще бъде 59/9. За да се обработват няколко последователни разделителя като един, към кода трябва да се добави „/MRG“. Ако файлът съдържа полета с фиксирана ширина, използвайте „FIX“. Пример: 44 (,)

2

Разделител за текст

Разделителят за текст като стойност от ASCII, например 34 за двойни кавички и 39 за единични. Пример: 34 (").

3

Знаков набор

Код за знаковия набор, използван във файла, както е описано в таблицата по-долу. Пример: 0 (системен).

4

Номер на ред за начало на четенето.

Импортиране от CSV

N: номер на ред, от който да започне четенето. Пример: 3 (да се започне от третия ред).

5

Кодове за формат на клетките за всяка колона

Импортиране от CSV

Последователност от кодове колона/формат, където стойностите за формат са от долната таблица. Пример: "1/5/2/1/3/1/4/1".

Ако се използват разделители за стойности, формата на този код е колона/формат[/колона/формат/…], където колона е номерът на колоната и 1 означава най-лявата колона. Кодовете на формати са описани по-долу.

Ако първият код е FIX, има формата начало/формат[/начало/формат/…], където начало е номерът на първия знак за това поле и 0 означава най-левият знак в реда. Форматът е обяснен по-долу.

6

Идентификатор на език

Низ в десетичен запис. Този код е еквивалентът на списъчното поле „Език“ в потребителския интерфейс за импортиране от CSV. Ако стойността е 0 или е пропусната, се използва идентификаторът на езика на потребителския интерфейс. Този параметър е базиран на идентификаторите на език на Microsoft.

7

Полета в кавички като текст

Низ, или false, или true. Подразбирана стойност: false. Този код е еквивалентът на полето за отметка „Полета в кавички като текст“.

8

Откриване на специални числа

Импортиране: низ, или false, или true. Подразбирана стойност: false. Този код е еквивалентът на полето за отметка „Откриване на специални числа“.

Export: String, either false or true. Default value: true. This token has no UI equivalent. If true, the number cells are stored as numbers. If false, the numbers are stored as text, with text delimiters.

9

Записване съдържанието на клетката както се вижда

Експортиране към CSV

Низ, или false, или true. Подразбирана стойност: true. Този код е еквивалентът на полето за отметка „Записване съдържанието на клетките както се вижда“.

10

Експортиране на формулите в клетките

Експортиране към CSV

Низ, или false, или true. Подразбирана стойност: false. Експортиране на формулите в клетките.

11

Премахване на интервалите

Импортиране от CSV

Низ, или false, или true. Подразбирана стойност: false. Премахване на интервалите. При четене на файла водещите и завършващите интервали се отрязват.

12

Експортиране на листове

Експортиране към CSV

Експортиране на целия документ към отделни .csv файлове за листовете или само на указан лист.

  • 0 или пропуснат означава подразбираното поведение: първия лист от командния ред или текущия лист в настройките на макро филтъра, експортиран към документ.csv.

  • -1: за всички листова, всеки лист се експортира към отделен файл с името на основния файл, обединено с името на листа, например документ-Лист1.csv, документ-Лист2.csv и документ-Лист3.csv.

  • N: експортиране на N-тия лист в диапазона на номерата на листовете. Например: за да експортирате втория лист, задайте тук 2, за да получите документ-Лист2.csv.

13

Импортиране като формули

Импортиране от CSV

Низ, или false, или true. Подразбирана стойност: false. Определя дали изразите формули, започващи със знак равно =, трябва да се изчисляват като формули, или да се импортират като текстови данни. Ако е true, формулите се изчисляват при въвеждане. Ако е false, формулите се въвеждат като текст. Ако е пропуснат (не присъства изобщо), подразбираната стойност е true, за да се запази поведението на настройките от старите версии, в които този код изобщо не фигурира. Ако е наличен и празен (или със стойност, различна от true), се подразбира стойност false.

14

Include a byte-order-mark (BOM)

String, either false or true. Default value: false. If true include a byte-order-mark (BOM) in the export. If false the export does not include a BOM. If omitted (not present at all), the default value is false to keep the behaviour of old versions' options string that didn't have this token at all. If present and empty (or any other value than true) the default value is false. Automatically detected during the import.

15

Detect numbers in scientific notation

String, either false or true. Default value: true. If true detect if a cell content containing an 'E' or 'e' is a number in scientific notation. If false do not try to detect numbers in scientific notation. Token can be false only if token 8 (Detect special numbers) is false. If omitted, the default value is true to keep the behaviour of old versions' options string that didn't have this token at all.


Частен случай на CSV файлове с разделител, дефиниран на първия ред

При импортиране и експортиране на CSV се поддържа настройка sep= и "sep=" за разделител на полетата. При четене на CSV документ разделителят се взема от началното единично поле sep= или "sep=", ако това е единственото съдържание на реда.

При четене на CSV файл ограденият с кавички вариант се запазва като съдържание на клетка (без кавичките). Ако разделителят в първия ред е |, виждате sep=|. При варианта без кавички разделителят се отхвърля, защото е действителен разделител на поле в този контекст. В първия ред виждате sep=.

При записване на CSV файл съществуващото съдържание на единична горна лява клетка, например sep=|, се адаптира към текущия разделител във варианта с кавички "sep=|" (ако кавичките / разделителите за текст не са зададени като празни и разделителят е |) и винаги се използва знакът двойна кавичка " от ASCII.

Ако редът, съдържащ sep=|, не трябва да се импортира като данни, не забравяйте да укажете стойност 2 за настройката От ред в диалога. Обърнете внимание, че този ред няма да бъде запазен при повторно записване.

Пример:


        sep=|
        "БУКВА"|"ЖИВОТНО"
        "а"|"антилопа"
        "б"|"бобър"
        "в"|"вълк"
    

Форматиращи кодове за позиция 5

Значение

Код

Стандартна

1

Текст

2

ММ/ДД/ГГ

3

ДД/ММ/ГГ

4

ГГ/ММ/ДД

5

-

6

-

7

-

8

Игнориране на полето (не се импортира)

9

Английски (САЩ)

10


Кодове на знакови набори за позиция 3

Знаков набор

Индекс

Неизвестен

0

Windows-1252/WinLatin 1 (западен)

1

Apple Macintosh (западен)

2

DOS/OS2-437/САЩ (западен)

3

DOS/OS2-850/международен (западен)

4

DOS/OS2-860/португалски (западен)

5

DOS/OS2-861/исландски (западен)

6

DOS/OS2-863/канадски френски (западен)

7

DOS/OS2-865/скандинавски (западен)

8

Подразбиран системен

9

Символен

10

ASCII/САЩ (западен)

11

ISO-8859-1 (западен)

12

ISO-8859-2 (централноевропейски)

13

ISO-8859-3 (латиница 3)

14

ISO-8859-4 (балтийски)

15

ISO-8859-5 (кирилица)

16

ISO-8859-6 (арабски)

17

ISO-8859-7 (гръцки)

18

ISO-8859-8 (иврит)

19

ISO-8859-9 (турски)

20

ISO-8859-14 (западен)

21

ISO-8859-15/EURO (западен)

22

DOS/OS2-737 (гръцки)

23

DOS/OS2-775 (балтийски)

24

DOS/OS2-852 (централноевропейски)

25

DOS/OS2-855 (кирилица)

26

DOS/OS2-857 (турски)

27

DOS/OS2-862 (иврит)

28

DOS/OS2-864 (арабски)

29

DOS/OS2-866/руски (кирилица)

30

DOS/OS2-869/съвременен (гръцки)

31

DOS/Windows-874 (тайски)

32

Windows-1250/WinLatin 2 (централноевропейски)

33

Windows-1251 (кирилица)

34

Windows-1253 (гръцки)

35

Windows-1254 (турски)

36

Windows-1255 (иврит)

37

Windows-1256 (арабски)

38

Windows-1257 (балтийски)

39

Windows-1258 (виетнамски)

40

Apple Macintosh (арабски)

41

Apple Macintosh (централноевропейски)

42

Apple Macintosh/хърватски (централноевропейски)

43

Apple Macintosh (кирилица)

44

Неподдържан: Apple Macintosh (деванагари)

45

Неподдържан: Apple Macintosh (фарси)

46

Apple Macintosh (гръцки)

47

Неподдържан: Apple Macintosh (гуджарати)

48

Неподдържан: Apple Macintosh (гурмукхи)

49

Apple Macintosh (иврит)

50

Apple Macintosh/исландски (западен)

51

Apple Macintosh/румънски (централноевропейски)

52

Apple Macintosh (тайски)

53

Apple Macintosh (турски)

54

Apple Macintosh/украински (кирилица)

55

Apple Macintosh (китайски, опростен)

56

Apple Macintosh (китайски, традиционен)

57

Apple Macintosh (японски)

58

Apple Macintosh (корейски)

59

Windows-932 (японски)

60

Windows-936 (китайски, опростен)

61

Windows-Wansung-949 (корейски)

62

Windows-950 (китайски, традиционен)

63

Shift-JIS (японски)

64

GB-2312 (китайски, опростен)

65

GBT-12345 (китайски, традиционен)

66

GBK/GB-2312-80 (китайски, опростен)

67

BIG5 (китайски, традиционен)

68

EUC-JP (японски)

69

EUC-CN (китайски, опростен)

70

EUC-TW (китайски, традиционен)

71

ISO-2022-JP (японски)

72

ISO-2022-CN (китайски, опростен)

73

KOI8-R (кирилица)

74

Уникод (UTF-7)

75

Уникод (UTF-8)

76

ISO-8859-10 (централноевропейски)

77

ISO-8859-13 (централноевропейски)

78

EUC-KR (корейски)

79

ISO-2022-KR (корейски)

80

JIS 0201 (японски)

81

JIS 0208 (японски)

82

JIS 0212 (японски)

83

Windows-Johab-1361 (корейски)

84

GB-18030 (китайски, опростен)

85

BIG5-HKSCS (китайски, традиционен)

86

TIS 620 (тайски)

87

KOI8-U (кирилица)

88

ISCII деванагари (индийски)

89

Уникод (модифициран явански UTF-8)

90

Adobe Standard

91

Adobe Symbol

92

PT 154 (кирилска азиатска кодова таблица за Windows, разработена в ParaType)

93

Уникод UCS4

65534

Уникод UCS2

65535