安静的栖居

安静的栖居

2007年7月7日星期六

文档标记语言种种(转)

想要舒服地编写文档,因此尝试了种种文档标记语言,略作一小节:

第一大类:Tex
Tex在计算科学与数学界是主流。
优点:1、排版漂亮;2、特别适合编写数学公式。
缺点:1、很难学;2、自定义难;3、中文支持较差;4、逐渐没落中。
结论:通常不适合计算科学与数学界以外的情形。

第二大类:DocBook
DocBook基于XML。
优点:1、继承了XML的优点。
缺点:1、较难学,要借助XSL等才能发挥功能;2、源文件可读性差;3、自定义难;4、转换过程复杂;5、转换速度慢;6、中文支持较差;7、标准未稳定。
结论:基本不适合计算科学与数学界以外的情形。

第三大类:结构化文本
属于这一类的有StructuredText、reStructuredText、txt2tags、AsciiDoc等,Wiki所使用的标记语言也可归于这一类。
优点:1、简单易学;2、源文件可读性佳;3、一般都有简单的转换工具提供,转化速度快。
缺点:1、功能较弱;2、不太流行。
结论:适合于一般应用。

第四大类:RTF
这是微软的东西。
优点:1、与Word兼容,能实现Word文档的绝大多数功能;2、功能较全面。
缺点:1、较难学;2、源文件可读性差。
结论:是其它格式转为Word文件的较好的中介。

第五大类:HTML
就是网页所用的东东。
优点:1、较易学;2、源文件可读性一般;3、便于展示;4、有各种可视化的编辑器;5、结合CSS很容易定制样式。
缺点:1、不适合打印。
结论:一般不会有人用HTML写文档吧,用它还不如直接用Word好了。

第六大类:OpenDocument和Office XML
这是最新的基于XML的标准。
优点:1、广泛的平台适应;2、可视化编辑器的支持,就是OpenOffice和MsOffice了;3、功能强大。
缺点:1、难学;2、源文件可读性差;3、两个标准在斗争中,需要选择立场,矛盾啊。
结论:这其实不是用来给人手写的,那会把你累死,还不如直接用可视化编辑器好了。

我的一点看法:
最为实用的应当是结构化文本,其中最好的也许是Wiki所使用的标记语言。既然说是文档,就不能仅仅考虑发布为网页,还要考虑适合于打印的发布方式。直接 转换为PDF可能较难,我的考虑是转换为RTF,然后在Word中发布为PDF。为什么要先经过RTF这一步呢?因为在Word里面比较容易进行纸张的排 版设置。
但是目前对RTF的支持较少,因此我上面所述的途径仅仅是我的设想,现实中还不可行。

0 条评论:

发表评论

订阅 博文评论 [Atom]

<< 主页