打开或编辑.doc .odt等文本文档命令:
openoffice -a 文件名.doc &
打开演示文件命令:
openoffice -g 文件名。. &
打开电子表格:
openoffice -c 文件名 &
进入再选择可以不加 ‘- ’直接打openoffice
打开pdf文件
evince 。..pdf &
打‘&’的目的是让文件在后台运行,命令行终端还能用。
如果忘了打&可以 Ctrl+z,然后打bg回车
文件名中含空格要打成'\ '
文件名太长不用打完,如 abcdefghijklmn.pdf
可以打完前几个
abc
然后点tab键,剩下的就自动打出来了。
了解更多开源相关,去LUPA社区看看吧。
2.如何在 Linux 上使用 Python 读取 word 文件信息必须说明:不同于Illustrator、InDesign、CorelDRAW、OpenOffice DRAW、Incscape等工具,Word是流动分页的,文件内容本身并不存储分页结果。具体分页时断在哪里、最后分出多少页,都需要现场渲染所有的图文内容之后才能确定。
(简而言之就是:Word文件中仅包含了一行一行的文本,与页面设置中指定的页面尺寸。Word每次打开文件时都会一行一行“摆放”文本数据,发现一页装不下了自动新开一页。当然真正的Word渲染引擎肯定有更复杂的行为。)
从.doc/.docx文件中直接读出页面数量,这本身就是个伪命题。所以千万别在“直接读取页面数量”这个方向上寻求方案——软件开发的技法不好可以改正,但路线错了必死无疑!
你需要调动一套能够真的把Word文件的内容渲染出来的工具(支持二次开发的)。只有把Word文件的所有内容渲染成为可以观看的图形,才能准确得知页面的总数。在Linux上很可能LibreOffice可以吧。而在Windows上就当然是用Word本身了。
注意Word的分页结论是没有保证的。缺少字体、字形不同、软件环境不同等各种原因,都会造成不同电脑上打开同一个Word文件的页数不一致。这一点对服务器也没有例外。得到了页数也只能参考使用,而不要100%信赖。
3.如何在 Linux 上使用 Python 读取 word 文件信息第一步:获取doc文件的xml组成文件import zipfiledef get_word_xml(docx_filename):with open(docx_filename) as f:zip = zipfile.ZipFile(f)xml_content = zip.read('word/document.xml')return xml_content第二步:解析xml为树形数据结构from lxml import etreedef get_xml_tree(xml_string):return etree.fromstring(xml_string)第三步:读取word内容:def _itertext(self, my_etree):"""Iterator to go through xml tree's text nodes"""for node in my_etree.iter(tag=etree.Element):if self._check_element_is(node, 't'):yield (node, node.text)def _check_element_is(self, element, type_char):word_schema = '99999'return element.tag == '{%s}%s' % (word_schema,type_char)。
4.Linux和Mac下,如何打开和查看Word文件linux和Mac可以用libreoffice打开word,excel,powerpiont文档。
LibreOffice是OpenOffice的分支目标是成为跨平台免费强大的个人办公软件。
目前最高版本为libreoffice5.0.2,支持windows,linux,Mac操作系统。
转载请注明出处51数据库 » linux读取word
- 0
- 0
- 0
- 0
- 0
更多推荐
linux读取word
发布评论