linux读取word

编程入门行业动态更新时间:2024-10-16 20:25:20

1.linux怎么打开doc文件

打开或编辑.doc .odt等文本文档命令：

openoffice -a 文件名.doc &

打开演示文件命令：

openoffice -g 文件名。. &

打开电子表格：

openoffice -c 文件名 &

进入再选择可以不加 ‘- ’直接打openoffice

打开pdf文件

evince 。..pdf &

打‘&’的目的是让文件在后台运行，命令行终端还能用。

如果忘了打&可以 Ctrl+z，然后打bg回车

文件名中含空格要打成'\ '

文件名太长不用打完，如 abcdefghijklmn.pdf

可以打完前几个

abc

然后点tab键，剩下的就自动打出来了。

了解更多开源相关，去LUPA社区看看吧。

2.如何在 Linux 上使用 Python 读取 word 文件信息

必须说明：不同于Illustrator、InDesign、CorelDRAW、OpenOffice DRAW、Incscape等工具，Word是流动分页的，文件内容本身并不存储分页结果。具体分页时断在哪里、最后分出多少页，都需要现场渲染所有的图文内容之后才能确定。

（简而言之就是：Word文件中仅包含了一行一行的文本，与页面设置中指定的页面尺寸。Word每次打开文件时都会一行一行“摆放”文本数据，发现一页装不下了自动新开一页。当然真正的Word渲染引擎肯定有更复杂的行为。）

从.doc/.docx文件中直接读出页面数量，这本身就是个伪命题。所以千万别在“直接读取页面数量”这个方向上寻求方案——软件开发的技法不好可以改正，但路线错了必死无疑！

你需要调动一套能够真的把Word文件的内容渲染出来的工具（支持二次开发的）。只有把Word文件的所有内容渲染成为可以观看的图形，才能准确得知页面的总数。在Linux上很可能LibreOffice可以吧。而在Windows上就当然是用Word本身了。

注意Word的分页结论是没有保证的。缺少字体、字形不同、软件环境不同等各种原因，都会造成不同电脑上打开同一个Word文件的页数不一致。这一点对服务器也没有例外。得到了页数也只能参考使用，而不要100%信赖。

3.如何在 Linux 上使用 Python 读取 word 文件信息

第一步：获取doc文件的xml组成文件import zipfiledef get_word_xml(docx_filename):with open(docx_filename) as f:zip = zipfile.ZipFile(f)xml_content = zip.read('word/document.xml')return xml_content第二步：解析xml为树形数据结构from lxml import etreedef get_xml_tree(xml_string):return etree.fromstring(xml_string)第三步：读取word内容：def _itertext(self, my_etree):"""Iterator to go through xml tree's text nodes"""for node in my_etree.iter(tag=etree.Element):if self._check_element_is(node, 't'):yield (node, node.text)def _check_element_is(self, element, type_char):word_schema = '99999'return element.tag == '{%s}%s' % (word_schema,type_char)。

4.Linux和Mac下,如何打开和查看Word文件

linux和Mac可以用libreoffice打开word,excel,powerpiont文档。

LibreOffice是OpenOffice的分支目标是成为跨平台免费强大的个人办公软件。

目前最高版本为libreoffice5.0.2，支持windows,linux,Mac操作系统。

转载请注明出处51数据库 » linux读取word

更多推荐

linux读取word

本文发布于:2023-06-06 01:34:48，感谢您对本站的认可！

本文链接:https://www.elefans.com/category/jswz/34/531132.html