求个大文本乱序的工具
txt文本,1G以上,按行乱序。求工具。之前用的都不行。
按行导到数据库去 然后... 1G文本,你电脑不死机么? 801023 发表于 2016-2-26 08:48
1G文本,你电脑不死机么?
16G内存,没什么问题。 54clz 发表于 2016-2-26 08:47
按行导到数据库去 然后...
然后怎么弄? 然后想办法打乱呗方法多得是
比如一个简单的SQL语句 INSERT INTO articles2 SELECT * from articles ORDER BY random()
你还可以通过限定条件范围多搞几次 它就乱了 我有个思路,把文件切割成几个小的,然后Python处理。 python用readlines读取txt文本,获得总行数,然后random sample应该可以 应该没有什么问题,先用StreamReader异步读取,要不行就使用内存文件映射读取 曾经在 bash下用命令行搞过,文件大小不是问题 http://stackoverflow.com/questions/2153882/how-can-i-shuffle-the-lines-of-a-text-file-on-the-unix-command-line-or-in-a-shel $ cat test.txt
1
2
3
4
5
6
7
8
9
10
11
12
$ cat test.txt | perl -MList::Util=shuffle -e 'print shuffle(<STDIN>);'
8
12
6
2
4
10
11
1
5
9
3
7
或者这个,如果你系统有shuf命令:
root@slackware:/tmp# cat test.txt
1
2
3
4
5
6
6
7
8
9
9
10
11
12
root@slackware:/tmp# shuf test.txt
6
10
11
7
1
5
3
9
6
4
12
8
9
2
shuf test.txt> output.txt 楼上屌爆了
页:
[1]
2