zhuzhaodan 发表于 2015-8-10 14:57:19

seanhere 发表于 2015-8-2 17:40
可以用数据库存放内容啊,我刚开始用文档存放内容,文档的修改和删除都非常麻烦,删除一百万文章都要几个 ...

数据库存内容,体积会小很多倍吗?我近期准备上个几百万页面的站点,但是不知道是直接放html页面还是存mysql,毕竟存数据库里面那就要查询数据库开销不小

seanhere 发表于 2015-8-10 16:40:03

zhuzhaodan 发表于 2015-8-10 14:57
数据库存内容,体积会小很多倍吗?我近期准备上个几百万页面的站点,但是不知道是直接放html页面还是存my ...

之前用文件存放数据,大约每篇文章3-5KB,百万文章要近4GB,MySQL存放大约百万文章1GB, MongoDB大约百万文章2GB,空间占用不是问题,我遇到的问题是 Linux下一个文件夹下放了几百万个html文件,删除起来非常非常慢,而数据库操作管理就非常方便

zhuzhaodan 发表于 2015-8-11 00:00:20

seanhere 发表于 2015-8-10 16:40
之前用文件存放数据,大约每篇文章3-5KB,百万文章要近4GB,MySQL存放大约百万文章1GB, MongoDB大约百万 ...

你的几百万文章,是怎么伪原创呢

seanhere 发表于 2015-8-11 10:57:39

zhuzhaodan 发表于 2015-8-11 00:00
你的几百万文章,是怎么伪原创呢

YOO版主的方法

uuivw 发表于 2015-8-11 16:38:11

内容是王啊:lol:lol:lol

不认识 发表于 2015-8-15 18:05:57

seanhere 发表于 2015-8-10 16:40
之前用文件存放数据,大约每篇文章3-5KB,百万文章要近4GB,MySQL存放大约百万文章1GB, MongoDB大约百万 ...

:'(好厉害,都是写程序的!

zhuzhaodan 发表于 2015-8-24 01:06:21

请问下你这些随机句子,单独的句子要做处理么,就是句子再做一下spin,再随机组合spin过后的句子,我现在弄了几亿条句子,想按照句子的意思相似度组合一下,再组合成文章,最小的单元是句子,现在发愁句子需要作处理吗,作处理的话工作量又加大了。。。

chazoon 发表于 2016-12-3 09:05:08

seanhere 发表于 2015-8-10 16:40
之前用文件存放数据,大约每篇文章3-5KB,百万文章要近4GB,MySQL存放大约百万文章1GB, MongoDB大约百万 ...

删除还怕难吗? cd进要删除的目录,rm -rf * 秒删

tufei1314 发表于 2018-2-20 11:38:54

哇怎么生成呀         
页: 1 2 [3]
查看完整版本: 我的几个收录百万的网站终于被惩罚了