核心概念
在开始之前,你需要理解织梦文章存储的核心结构:

(图片来源网络,侵删)
- 主表 (
dede_archives):存储文章的核心信息,如标题、作者、来源、发布时间、点击量、所属栏目ID (typeid) 等。 - 附加表 (
dede_addonarticle):存储文章的具体内容,如文章正文 (body) 等。
批量导入的本质:就是同时向这两张表中插入数据,并确保 dede_archives 表中的 id 和 dede_addonarticle 表中的 aid(文章ID)是相互关联的。
使用织梦后台自带的“采集”功能(最推荐、最安全)
很多人以为“采集”只能从其他网站抓取,但实际上,织梦的采集功能非常强大,也可以用来处理本地或本地的数据,是官方推荐的批量导入方式。
优点:
- 完全官方支持,兼容性好。
- 导入后,文章ID会自动续接,不会产生乱码。
- 支持字段映射,可以灵活处理不同格式的数据。
- 安全性高,对系统无破坏风险。
操作步骤:

(图片来源网络,侵删)
-
准备数据文件:
- 格式:织梦采集器支持多种格式,最常用的是 TXT 和 HTML。
- TXT格式:将每一篇文章的内容保存为一个单独的
.txt文件,文件名可以设置为文章标题,方便识别。 - HTML格式:如果文章本身有格式(如加粗、列表、图片),保存为
.html文件效果更好。 - 存放:创建一个文件夹,将所有文章文件(.txt 或 .html)放入其中。
-
进入后台采集:
- 登录织梦后台。
- 菜单路径:【采集】 -> 【远程采集】 -> 【采集节点管理】
-
创建采集节点:
- 点击 “增加新节点”。
- 节点名称:起一个容易识别的名字,如“本地文章导入”。
- 目标网址:这里填写一个本地路径,指向你存放文章的文件夹,如果你的网站根目录下有个
import_files文件夹,就填写http://你的域名/import_files/。注意: 这个文件夹必须可以通过浏览器访问到,所以你可能需要把它放在网站根目录下。 - 链接:选择 “列表链接”。
- 列表链接:使用通配符 来匹配所有文件,如果是txt文件,就填
*.txt;如果是html文件,就填*.html。 - 列表起始链接:可以留空,或者填写一个示例文件名。
- 分页:选择“无分页”。
-
设置字段映射(最关键的一步):
(图片来源网络,侵删)- 切换到 “字段映射” 标签页。
- 你需要将你文件中的内容,与织梦的文章字段对应起来。
- 示例:
- :如果你的文件名就是标题,选择 “文件名”在文件内容的开头,可以使用 “正则表达式” 或 “采集文本” 来提取。
- :选择 “采集正文”,织梦会自动读取整个文件的内容作为文章正文。
- 作者:可以选择 “自定义”,然后输入一个固定的作者名,或者如果文件中有特定格式,可以用正则表达式提取。
- 栏目:选择 “自定义”,然后从下拉菜单中选择你要导入的目标栏目。
- 来源:同样可以设置为“自定义”。
- Tags标签:如果文件中有标签,可以用正则表达式提取,否则留空。
- 发布时间:可以选择“当前时间”或“自定义”。
-
保存并测试:
- 保存节点设置。
- 在节点列表中找到你创建的节点,点击后面的 “测试” 按钮。
- 查看是否能正确获取到文章标题和内容,如果测试成功,说明字段映射正确。
-
开始采集:
- 测试无误后,点击该节点后面的 “开始采集”。
- 系统会自动扫描文件夹中的所有文件,并根据你的设置逐个导入到数据库中。
- 采集完成后,去你的网站前台或后台的文章列表中查看,文章应该已经成功导入。
使用第三方批量导入插件
如果觉得官方采集功能设置太复杂,或者有更特殊的需求(如直接从Excel/Word导入),可以考虑第三方插件。
优点:
- 界面通常更友好,操作简单,可能支持Excel、Word等格式。
- 功能更“傻瓜化”,适合不熟悉采集规则的用户。
缺点:
- 兼容性不确定,可能与你的织梦版本或某些模板冲突。
- 来源不明,可能存在安全风险(后门、代码冗余)。
- 很多是付费插件或需要授权。
如何寻找:
- 在织梦官方论坛、Dedecms模板网等地方搜索关键词:“织梦批量导入插件”、“织梦Excel导入文章”、“DedeCMS 批量发布工具”。
- 购买前最好先试用,并检查插件的评价和安全性。
使用流程:
- 下载插件并按照说明上传到网站指定目录(通常是
/dede/或/include/下的某个文件夹)。 - 在后台菜单中找到插件对应的入口。
- 上传你的数据文件(如Excel)。
- 按照插件提示进行字段匹配(Excel的A列对应标题,B列对应内容等)。
- 选择目标栏目,点击导入即可。
手动SQL导入(高级用户,适合数据迁移)
如果你已经有整理好的、格式规范的SQL文件,或者技术能力较强,这是最快、最直接的方法。
优点:
- 速度极快,适合导入大量数据。
- 精确控制数据,适合从另一个织梦网站迁移数据。
缺点:
- 风险高,如果SQL语句或数据格式有误,可能导致数据库损坏。
- 需要一定的数据库和SQL知识。
- 文章ID容易冲突,需要手动处理。
操作步骤(以从旧站迁移为例):
-
导出旧站数据:
- 在旧站的数据库管理工具(如phpMyAdmin)中,执行以下SQL语句,导出数据:
SELECT * FROM `dede_archives` WHERE typeid IN (你的目标栏目ID列表); SELECT * FROM `dede_addonarticle` WHERE aid IN (SELECT id FROM `dede_archives` WHERE typeid IN (你的目标栏目ID列表));
- 将导出的两个SQL文件保存好。
- 在旧站的数据库管理工具(如phpMyAdmin)中,执行以下SQL语句,导出数据:
-
处理ID冲突(关键!):
- 登录新站的数据库,查看
dede_archives表的id字段当前的最大值,假设为1000。 - 用文本编辑器打开第一个SQL文件(
dede_archives的),将所有的id值都加上一个偏移量,1001,即id变成id + 1001。 - 同样,打开第二个SQL文件(
dede_addonarticle的),将所有的aid值也加上相同的偏移量1001。
- 登录新站的数据库,查看
-
导入新站:
- 在新站的phpMyAdmin中,选择你的数据库。
- 点击“导入”选项卡。
- 先导入处理过的
dede_archives的SQL文件。 - 再导入处理过的
dede_addonarticle的SQL文件。
-
更新栏目和URL:
- 如果栏目结构有变化,需要手动更新
dede_archives表中的typeid。 - 如果网站域名变了,需要使用织梦的 【系统】->【数据库备份/还原】->【SQL命令行工具】,执行以下命令来替换文章中的旧域名:
UPDATE `dede_archives` SET title = REPLACE(title, '旧域名', '新域名'); UPDATE `dede_addonarticle` SET body = REPLACE(body, '旧域名', '新域名');
- 如果栏目结构有变化,需要手动更新
总结与建议
| 方法 | 优点 | 缺点 | 推荐人群 |
|---|---|---|---|
| 官方采集 | 安全、稳定、官方支持、ID自动续接 | 设置相对复杂,需要理解字段映射 | 所有用户,尤其是新手和追求稳定性的用户 |
| 第三方插件 | 操作简单,可能支持Excel/Word | 有安全风险,兼容性不确定,可能付费 | 不懂采集,需要快速导入Excel/Word格式的用户 |
| 手动SQL | 速度极快,控制力强 | 风险高,需要技术,ID处理麻烦 | 有一定技术基础,用于数据迁移或超大规模导入的专业用户 |
给新手的建议: 首选方法一:官方采集功能,虽然看起来步骤多,但每一步都很清晰,并且是织梦官方最成熟、最安全的方案,花点时间学习一下,绝对物有所值,在正式导入前,一定要先备份你的数据库,以防万一。
