linux读取word

编程入门 行业动态 更新时间:2024-10-16 20:25:20
1.linux怎么打开doc文件

打开或编辑.doc .odt等文本文档命令:

openoffice -a 文件名.doc &

打开演示文件命令:

openoffice -g 文件名。. &

打开电子表格:

openoffice -c 文件名 &

进入再选择可以不加 ‘- ’直接打openoffice

打开pdf文件

evince 。..pdf &

打‘&’的目的是让文件在后台运行,命令行终端还能用。

如果忘了打&可以 Ctrl+z,然后打bg回车

文件名中含空格要打成'\ '

文件名太长不用打完,如 abcdefghijklmn.pdf

可以打完前几个

abc

然后点tab键,剩下的就自动打出来了。

了解更多开源相关,去LUPA社区看看吧。

2.如何在 Linux 上使用 Python 读取 word 文件信息

必须说明:不同于Illustrator、InDesign、CorelDRAW、OpenOffice DRAW、Incscape等工具,Word是流动分页的,文件内容本身并不存储分页结果。具体分页时断在哪里、最后分出多少页,都需要现场渲染所有的图文内容之后才能确定。

(简而言之就是:Word文件中仅包含了一行一行的文本,与页面设置中指定的页面尺寸。Word每次打开文件时都会一行一行“摆放”文本数据,发现一页装不下了自动新开一页。当然真正的Word渲染引擎肯定有更复杂的行为。)

从.doc/.docx文件中直接读出页面数量,这本身就是个伪命题。所以千万别在“直接读取页面数量”这个方向上寻求方案——软件开发的技法不好可以改正,但路线错了必死无疑!

你需要调动一套能够真的把Word文件的内容渲染出来的工具(支持二次开发的)。只有把Word文件的所有内容渲染成为可以观看的图形,才能准确得知页面的总数。在Linux上很可能LibreOffice可以吧。而在Windows上就当然是用Word本身了。

注意Word的分页结论是没有保证的。缺少字体、字形不同、软件环境不同等各种原因,都会造成不同电脑上打开同一个Word文件的页数不一致。这一点对服务器也没有例外。得到了页数也只能参考使用,而不要100%信赖。

3.如何在 Linux 上使用 Python 读取 word 文件信息

第一步:获取doc文件的xml组成文件import zipfiledef get_word_xml(docx_filename):with open(docx_filename) as f:zip = zipfile.ZipFile(f)xml_content = zip.read('word/document.xml')return xml_content第二步:解析xml为树形数据结构from lxml import etreedef get_xml_tree(xml_string):return etree.fromstring(xml_string)第三步:读取word内容:def _itertext(self, my_etree):"""Iterator to go through xml tree's text nodes"""for node in my_etree.iter(tag=etree.Element):if self._check_element_is(node, 't'):yield (node, node.text)def _check_element_is(self, element, type_char):word_schema = '99999'return element.tag == '{%s}%s' % (word_schema,type_char)。

4.Linux和Mac下,如何打开和查看Word文件

linux和Mac可以用libreoffice打开word,excel,powerpiont文档。

LibreOffice是OpenOffice的分支目标是成为跨平台免费强大的个人办公软件。

目前最高版本为libreoffice5.0.2,支持windows,linux,Mac操作系统。

转载请注明出处51数据库 » linux读取word

  • 0
  • 0
  • 0
  • 0
  • 0

更多推荐

linux读取word

本文发布于:2023-06-06 01:34:48,感谢您对本站的认可!
本文链接:https://www.elefans.com/category/jswz/34/531132.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
本文标签:linux   word

发布评论

评论列表 (有 0 条评论)
草根站长

>www.elefans.com

编程频道|电子爱好者 - 技术资讯及电子产品介绍!