mysql 的load data infile

2019-01-03 14:46:31于丽


LOAD DATA INFILE 是SELECT ... INTO OUTFILE 的反操作。参考SELECT 语法 。 使用SELECT ... INTO OUTFILE 将数据从一个数据库写到一个文件中。使用LOAD DATA INFILE 读取文件到数据库中。两个命令的FIELDS 和LINES 子句的语法是一样的。两个子句都是可选的,但是如果两个同时被指定,FIELDS 子句必须出现在LINES 子句之前。
如果用户指定一个FIELDS 子句,它的子句 (TERMINATED BY、[OPTIONALLY] ENCLOSED BY 和ESCAPED BY) 也是可选的,不过,用户必须至少指定它们中的一个。
如果用户没有指定一个FIELDS 子句,缺省时如同使用下列语句:
FIELDS TERMINATED BY 't' ENCLOSED BY '' ESCAPED BY ''
如果用户没有指定一个LINES 子句,缺省时如同使用下列语句:
LINES TERMINATED BY 'n' STARTING BY ''
换句话说,当读取输入时,缺省的LOAD DATA INFILE 表现如下:
• 在换行符处寻找行的边界。
• 不遗漏任何行前缀。
• 在制表符处将行分离成字段。
• 不认为字段由任何引号字符封装。
• 将有 “” 开头的定位符、换行符或`' 解释为字段值的一个文字字符。
相反的,当写入输出时,缺省值导致SELECT ... INTO OUTFILE 表现如下:
• 在字段值间加上制表符。
• 不用任何引号字符封装字段。
• 使用 “” 转义出现在字段值中的定位符、换行符或`' 字符实例。
• 在行的结尾处加上换行符。
注意:

为了写FIELDS ESCAPED BY '',用户必须指定两个反斜线,该值会作为一个反斜线被读入。
注意:

如果是Windows 系统的文本文件,可能必须使用LINES TERMINATED BY 'rn' 来读取文件,这是因为Windows 系统的特点是使用两个字符作为行终止符。在某些程序中,在书写文件时,可能使用r 作为行终止符,如写字板。读取这类文件时,需要用LINES TERMINATED BY 'r'。
如果所有的将要读取的行都有用户希望忽略的前缀,可以使用LINES STARTING BY 'prefix_string' 来跳过此前缀(和在它前面的任何内容)。如果一个行没有此前缀,则整个行都被跳过。注意,prefix_string 可能在行的中间!
例如:
sqlcli> LOAD DATA INFILE '/tmp/test.txt'
-> INTO TABLE test LINES STARTING BY "xxx";

用它读取包含有下面内容的文件:

xxx"Row",1
something xxx"Row",2
则可以得到数据(“row”,1)和(“row”,2)。

IGNORE number LINES 这个选项可以用来忽略文件开头部分的行。例如,可以用IGNORE 1 LINES 来跳过含有列名的的头一行:
sqlcli> LOAD DATA INFILE '/tmp/test.txt'
-> INTO TABLE test IGNORE 1 LINES;
当用户一前一后地使用SELECT ... INTO OUTFILE 和LOAD DATA INFILE 将数据从一个数据库写到一个文件中,然后再从文件中将它读入数据库中时,两个命令的字段和行处理选项必须匹配。否则,LOAD DATA INFILE 将不能正确地解释文件内容。假设用户使用SELECT ... INTO OUTFILE 以逗号分隔字段的方式将数据写入到一个文件中: