データが区切り文字または幅が固定された列を使用して保存されている場合に、1 つ以上のテキストファイルからデータを取得できます。区切り文字を使用するテキストファイルには、カンマ区切り値 (.csv) ファイルなどがあります。
.csv ファイルには、数値およびテキストがテキスト形式で保存されます。各レコードは、通常、カンマまたはタブで区切られたフィールドで構成されます。また、レコードは、改行によって区切られます。これは、データがカンマで区切られた .csv ファイルの例です。
"Product","Country","Year","Quantity","Margin" "Skis","Italy","2013","1,297","1,929" "Computers","China","2014","609","10,659"
この .csv ファイルからデータを取得すると、データセットに "Product"、Country"、"Year"、"Quantity"、"Margin" の 5 つの列が生成されます。この例の列 2 には、値 "Country"、"Italy"、"China" が含まれます。
これは、幅が固定された列に保存されているデータを含むテキストファイルの例です。
Product Country Year Quantity Margin Skis Italy 2013 1,297 1,929 Computers China 2014 609 10,659
オプション |
説明 |
|---|---|
データセット名 |
データセットの名前 |
ファイル |
新しいデータセットのデータを含むファイルまたは複数のファイル1 つまたは複数のファイルからデータをインポートすることができます。複数のファイルを指定するには、ファイルフィールドでセミコロンを使用してファイルパスを区切るか、またはファイルの追加を選択して 1 つまたは複数のファイルを選択し、選択に追加します。 |
区切り文字 |
ファイル内のデータが区切り文字によって区切られるのか、または幅が固定された列に入力されるのかを選択します。区切り文字は、データソース内のフィールドを区切り、SAP Lumira のデータセット内の列を指定する、カンマ、タブ、スペースなどの記号です。 |
最初の行を列名として設定 |
このチェックボックスを選択すると、データの最初の行がデータセットの列名として使用されます。 このチェックボックスの選択を解除して、デフォルトの列名 ("Column1"、"Column2" など) を使用します。 |
|
データセット内の数値列の書式 |
|
データセット内の日付列の書式 |
|
幅が固定された列として保存されたデータの取得時には、データファイルが分析され、データをデータセットの列に分割するための列幅が文字数で提案されます。 提案された幅が適切ではない場合は、カンマで区切った値を入力して幅を変更できます。たとえば、データが 3 つの列に含まれており、列幅が 5 文字、10 文字、15 文字である場合、ブレーク列ボックスに 5,10,15 を入力し、適用を選択して、結果データセットのプレビューを表示します。 |
|
このチェックボックスを選択すると、データセット内の数値およびテキストから先頭の値と末尾の値が削除されます。そのため、列ヘッダが空白フィールドとして表示されることはありません。たとえば、"Product" というエントリの先頭にスペースがある場合 (" Product")、スペースが削除され、"Product" が列ヘッダとして表示されます。 |