Opcje filtra CSV

Filtr CSV akceptuje ciąg opcji zawierający od pięciu do trzynastu tokenów oddzielonych przecinkami. Tokeny od 6 do 13 są opcjonalne.

Przykład:

Import z UTF-8, język niemiecki, oddzielone przecinkami, ogranicznik tekstu ", pole w cudzysłowie jako tekst. Plik CSV zawiera kolumny sformatowane jako data, liczba, liczba i liczba:

soffice --infilter="Text - txt - csv (StarCalc):44,34,76,1,1/5/2/1/3/1/4/1,1031,true,true" test.csv

Eksportuj do Windows-1252, ogranicznik pola: przecinek, ogranicznik tekstu: cytat, zapisz zawartość komórki jak przedstawiono:

soffice --convert-to "Text - txt - csv (StarCalc):44,34,ANSI,1,,0,false,true,true" --outdir=/home/user test.ods

Pozycja tokena

Definicja

Znaczenie i przykład tokena

1

Separator pól

Separatory pól jako wartości ASCII. Wiele wartości jest oddzielonych znakiem ukośnika ("/"), co oznacza, że jeśli wartości są oddzielone średnikami i tabulatorami poziomymi, tokenem będzie 59/9. Aby traktować kilka kolejnych separatorów jako jeden, należy dołączyć "/MRG" do tokena. Jeśli plik zawiera pola o stałej szerokości, użyj opcji "FIX". Przykład: 44 (,)

2

Ogranicznik tekstu

Ogranicznik tekstu jako wartość ASCII, np. 34 w cudzysłowach podwójnych i 39 w cudzysłowach pojedynczych. Przykład: 34 (").

3

Zestaw znaków

Kod zestawu znaków używany w pliku zgodnie z opisem w poniższej tabeli. Przykład: 0 (system).

4

Numer wiersza, aby rozpocząć odczyt.

Import CSV

N: numer wiersza, od którego należy rozpocząć odczyt pliku. Przykład: 3 (zaczyna się od trzeciego wiersza).

5

Kod formatowania komórek dla każdej kolumny

Import CSV

Sekwencja kodu kolumny/formatowania, gdzie kod formatowania jest podany w poniższej tabeli. Przykład: "1/5/2/1/3/1/4/1".

Jeśli używane są separatory wartości, postać tego tokena to kolumna/format[/kolumna/format/…], gdzie kolumna to numer kolumny, gdzie 1 to kolumna znajdująca się najbardziej po lewej stronie. Kod formatu jest szczegółowo opisany poniżej.

Jeśli pierwszym tokenem jest FIX, ma on postać start/format[/start/format/…], gdzie start to numer pierwszego znaku dla tego pola, gdzie 0 to znak znajdujący się najbardziej na lewo w wierszu. Format wyjaśniono poniżej.

6

Identyfikator języka

Ciąg wyrażony w notacji dziesiętnej. Ten token jest odpowiednikiem pola listy "Język" w interfejsie użytkownika do importu pliku CSV. Jeśli wartość wynosi 0 lub jest pominięta, używany jest identyfikator języka interfejsu użytkownika. Identyfikator języka jest oparty na identyfikatorach języka firmy Microsoft.

7

Cytowane pole jako tekst

Ciąg, false albo true. Wartość domyślna: false. Token ten jest odpowiednikiem pola wyboru "Cytowane pole jako tekst".

8

Wykryj numery specjalne

Importuj: ciąg znaków, false albo true. Wartość domyślna: false. Token ten jest odpowiednikiem pola wyboru "Wykryj numery specjalne".

Eksportuj: ciąg, "false" lub "true". Wartość domyślna: true. Ten token nie ma odpowiednika w interfejsie użytkownika. Jeśli true, komórki liczbowe są przechowywane jako liczby. Jeśli false, liczby są przechowywane jako tekst z ogranicznikami tekstu.

9

Zapisz zawartość komórki jak przedstawiono

Eksport CSV

Ciąg, false albo true. Wartość domyślna:true. Token ten jest odpowiednikiem pola wyboru "Zapisz zawartość komórki jak przedstawiono".

10

Eksportuj formuły komórek

Eksport CSV

Ciąg, false albo true. Wartość domyślna: false. Eksportuj formuły komórek.

11

Usuń odstępy

Import CSV

Ciąg, false albo true. Wartość domyślna: false. Usuń odstępy. Przycinaj początkowe i końcowe odstępy podczas odczytu pliku.

12

Eksportuj arkusze

Eksport CSV

Eksportuj cały dokument do pojedynczych arkuszy plików .csv lub określonego arkusza.

  • 0 lub brak: oznacza zachowanie domyślne, pierwszy arkusz z wiersza poleceń lub bieżący arkusz w opcjach filtra makr, wyeksportowany do pliku sample.csv

  • -1: dla wszystkich arkuszy każdy arkusz jest eksportowany do osobnego pliku o nazwie podstawowej połączonej z nazwą arkusza, na przykład próbka-Arkusz1.csv, próbka-Arkusz2.csv i próbka-Arkusz3 .csv

  • N: eksportuj n-ty arkusz w zakresie liczby arkuszy. Przykład: aby wyeksportować drugi arkusz, ustaw tutaj 2, aby uzyskać plik próbka-Arkusz2.csv

13

Importuj jako formuły

Import CSV

Ciąg, false albo true. Wartość domyślna: false. Określa, czy wyrażenia formuł zaczynające się od znaku równości = mają być oceniane jako formuły, czy importowane jako dane tekstowe. Jeśli true ocenia formuły na wejściu. Jeśli false formuły są wprowadzane jako tekst. Jeśli zostanie pominięty (w ogóle nie występuje), domyślną wartością jest true, aby zachować zachowanie ciągu opcji ze starych wersji, które w ogóle nie miały tego tokena. Jeśli obecny i pusty (lub dowolna inna wartość niż true), domyślną wartością jest false.


Specjalny przypadek plików CSV z separatorem zdefiniowanym w pierwszym wierszu

Import i eksport CSV obsługują ustawienie separatora pól sep= i "sep=". Podczas odczytu dokumentu CSV separator jest pobierany z początkowego pojedynczego pola sep= lub "sep=", jeśli jest to jedyna treść wiersza.

Podczas odczytywania pliku CSV cytowana forma jest zachowywana jako (niecytowana) zawartość komórki. Widzisz sep=|, gdy | jest separatorem w pierwszym wierszu. W formie bez cudzysłowów separator jest odrzucany, ponieważ jest to rzeczywisty separator pól w kontekście. Widzisz sep= w pierwszym wierszu.

Podczas zapisywania pliku CSV, istniejąca zawartość pojedynczej komórki w lewym górnym rogu, taka jak sep=| jest dopasowywana do bieżącego separatora za pomocą cytowanej formy "sep=|" (jeśli cudzysłowy/ograniczniki tekstu nie są puste, a | jest separatorem) i zawsze używa znaku podwójnego cudzysłowu ASCII ".

Jeśli wiersz zawierający sep=| nie ma być importowany jako dane, pamiętaj o ustawieniu numeru Od wiersza w oknie dialogowym na 2. Zauważ, że ten wiersz nie będzie zachowane podczas ponownego zapisywania.

Przykład:


        sep=|
        "LITERA"|"ZWIERZĘ"
        "a"|"antylopa"
        "b"|"bocian"
        "c"|"chomik"
    

Kody formatowania dla tokena 5

Znaczenie

Kod

Standardowy

1

Теkst

2

MM/DD/RR

3

DD/MM/RR

4

RR/MM/DD

5

-

6

-

7

-

8

Ignoruj pole (nie importuj)

9

Angielski (USA)

10


Kody zestawów znaków dla tokena 3

Character set

Index

Unknown

0

Windows-1252/WinLatin 1 (Western)

1

Apple Macintosh (Western)

2

DOS/OS2-437/US (Western)

3

DOS/OS2-850/International (Western)

4

DOS/OS2-860/Portuguese (Western)

5

DOS/OS2-861/Icelandic (Western)

6

DOS/OS2-863/Canadian-French (Western)

7

DOS/OS2-865/Nordic (Western)

8

System default

9

Symbol

10

ASCII/US (Western)

11

ISO-8859-1 (Western)

12

ISO-8859-2 (Central European)

13

ISO-8859-3 (Latin 3)

14

ISO-8859-4 (Baltic)

15

ISO-8859-5 (Cyrillic)

16

ISO-8859-6 (Arabic)

17

ISO-8859-7 (Greek)

18

ISO-8859-8 (Hebrew)

19

ISO-8859-9 (Turkish)

20

ISO-8859-14 (Western)

21

ISO-8859-15/EURO (Western)

22

DOS/OS2-737 (Greek)

23

DOS/OS2-775 (Baltic)

24

DOS/OS2-852 (Central European)

25

DOS/OS2-855 (Cyrillic)

26

DOS/OS2-857 (Turkish)

27

DOS/OS2-862 (Hebrew)

28

DOS/OS2-864 (Arabic)

29

DOS/OS2-866/Russian (Cyrillic)

30

DOS/OS2-869/Modern (Greek)

31

DOS/Windows-874 (Thai)

32

Windows-1250/WinLatin 2 (Central European)

33

Windows-1251 (Cyrillic)

34

Windows-1253 (Greek)

35

Windows-1254 (Turkish)

36

Windows-1255 (Hebrew)

37

Windows-1256 (Arabic)

38

Windows-1257 (Baltic)

39

Windows-1258 (Vietnamese)

40

Apple Macintosh (Arabic)

41

Apple Macintosh (Central European)

42

Apple Macintosh/Croatian (Central European)

43

Apple Macintosh (Cyrillic)

44

Not supported: Apple Macintosh (Devanagari)

45

Not supported: Apple Macintosh (Farsi)

46

Apple Macintosh (Greek)

47

Not supported: Apple Macintosh (Gujarati)

48

Not supported: Apple Macintosh (Gurmukhi)

49

Apple Macintosh (Hebrew)

50

Apple Macintosh/Icelandic (Western)

51

Apple Macintosh/Romanian (Central European)

52

Apple Macintosh (Thai)

53

Apple Macintosh (Turkish)

54

Apple Macintosh/Ukrainian (Cyrillic)

55

Apple Macintosh (Chinese Simplified)

56

Apple Macintosh (Chinese Traditional)

57

Apple Macintosh (Japanese)

58

Apple Macintosh (Korean)

59

Windows-932 (Japanese)

60

Windows-936 (Chinese Simplified)

61

Windows-Wansung-949 (Korean)

62

Windows-950 (Chinese Traditional)

63

Shift-JIS (Japanese)

64

GB-2312 (Chinese Simplified)

65

GBT-12345 (Chinese Traditional)

66

GBK/GB-2312-80 (Chinese Simplified)

67

BIG5 (Chinese Traditional)

68

EUC-JP (Japanese)

69

EUC-CN (Chinese Simplified)

70

EUC-TW (Chinese Traditional)

71

ISO-2022-JP (Japanese)

72

ISO-2022-CN (Chinese Simplified)

73

KOI8-R (Cyrillic)

74

Unicode (UTF-7)

75

Unicode (UTF-8)

76

ISO-8859-10 (Central European)

77

ISO-8859-13 (Central European)

78

EUC-KR (Korean)

79

ISO-2022-KR (Korean)

80

JIS 0201 (Japanese)

81

JIS 0208 (Japanese)

82

JIS 0212 (Japanese)

83

Windows-Johab-1361 (Korean)

84

GB-18030 (Chinese Simplified)

85

BIG5-HKSCS (Chinese Traditional)

86

TIS 620 (Thai)

87

KOI8-U (Cyrillic)

88

ISCII Devanagari (Indian)

89

Unicode (Java's modified UTF-8)

90

Adobe Standard

91

Adobe Symbol

92

PT 154 (Windows Cyrillic Asian codepage developed in ParaType)

93

Unicode UCS4

65534

Unicode UCS2

65535