欢迎您访问程序员文章站本站旨在为大家提供分享程序员计算机编程知识!
您现在的位置是: 首页  >  科技

linux系统下分割大文件的方法

程序员文章站 2023-11-28 09:47:28
本文介绍下在linux系统中,分割大文件的方法,比如一个5gb日志文件切割为很多小块。有需要的朋友参考下... 13-11-07...

在linux中分割大文件,比如一个5gb日志文件,需要把它分成多个小文件,分割后以利于普通的文本编辑器读取。
有时,需要传输20gb的大文件到另一台服务器,也需要把它分割成多个文件,这样便于传输数据。

以下通过五个不同的例子,来讲解linux下分割大文件的方法,供大家参考。

例1、以每个文件1000行分割

split命令分割文件成每个文件1000行,并且文件名依次为 [前缀]aa, [前缀]ab, [前缀]ac等,默认的前缀是x,每个文件的行数为1000行。
命令:


复制代码
代码如下:

$ split mylog -l 1000
$ wc -l *
4450 mylog
1000 xaa
1000 xab
1000 xac
1000 xad
450 xae

例2、以每个文件20mb分割
分割文件为多个20mb的文件,附带-b选项。

命令:


复制代码
代码如下:

$ split -b 20m logdata
$ ls -lh | tail -n +2
-rw------- 1 sathiya sathiya 102m jul 25 18:47 logdata
-rw------- 1 sathiya sathiya 20m jul 25 19:20 xaa
-rw------- 1 sathiya sathiya 20m jul 25 19:20 xab
-rw------- 1 sathiya sathiya 20m jul 25 19:20 xac
-rw------- 1 sathiya sathiya 20m jul 25 19:20 xad
-rw------- 1 sathiya sathiya 20m jul 25 19:20 xae
-rw------- 1 sathiya sathiya 1.6m jul 25 19:20 xaf

例3、以每个文件50mb指定前缀分割
使用–bytes选项把文件分割成多个50mb的文件,–bytes类似-b选项,在第二个参数指定前缀。

命令:


复制代码
代码如下:

$ split --bytes=50m logdata mydatafile
$ ls -lh
total 204m
-rw------- 1 sathiya sathiya 102m jul 25 18:47 logdata
-rw------- 1 sathiya sathiya 50m jul 25 19:23 mydatafileaa
-rw------- 1 sathiya sathiya 50m jul 25 19:23 mydatafileab
-rw------- 1 sathiya sathiya 1.6m jul 25 19:23 mydatafileac

例4、基于行数分割文件
使用-l选项指定行数来把文件分割成多个行数相同的文件。
命令:


复制代码
代码如下:

$ wc -l testfile
2591 testfile
$ split -l 1500 testfile importantlog
$ wc -l *
1500 importantlogaa
1091 importantlogab
2591 testfile

例5、以数字后缀命名分割文件
使用-d选项可以指定后缀为数字,如00,01,02..,而不是aa,ab,ac。

命令:


复制代码
代码如下:

$ split -d testfile
$ ls
testfile x00 x01 x02

可用选项


复制代码
代码如下:

短选项 长选项 选项描述
-b –bytes=size size 值为每一输出档案的大小,单位为 byte。
-c –line-bytes=size 每一输出档中,单行的最大 byte 数。
-d –numeric-suffixes 使用数字作为后缀。
-l –lines=number number 值为每一输出档的列数大小。</p> <p>短选项 长选项 选项描述
-b –bytes=size size 值为每一输出档案的大小,单位为 byte。
-c –line-bytes=size 每一输出档中,单行的最大 byte 数。
-d –numeric-suffixes 使用数字作为后缀。
-l –lines=number number 值为每一输出档的列数大小。