admin管理员组

文章数量:1566354

2024年7月27日发(作者:)

书法字库的设计实现与管理

邱明锋

【摘 要】通过对书法字库现状分析,阐述了书法字模创作、纸质书法字模二值化处

理,数字书法图像切分、曲线轮廓描述与编码的过程;应用OpenType字形技术的开

源性来设计书法字库的特殊性和添加连笔、行气、章法、风格等脚本;利用字库编

辑软件与脚本工具生成OpenType书法字库.提出了解决当前网页、手机浏览缺失

书法字体的思路,是设计出与世界文字信息交流相匹配的书法字库,并实现其在操作

系统中的管理,使中国传统的书法文化能在电子信息交流中更好地得到传承和发展.

【期刊名称】《中文信息学报》

【年(卷),期】2014(028)004

【总页数】8页(P145-152)

【关键词】书法信息传播;图像二值化;字形技术;书法字库;字体管理

【作 者】邱明锋

【作者单位】内江职业技术学院,四川内江641001;内江市市中区硬笔书法协会,四

川内江641001

【正文语种】中 文

【中图分类】TP391

1 引言

文字是人类文化的伟大创造,而书法则是以汉字为基础的华夏民族的伟大文化创造。

文字和书法是表达各种文化信息的载体,是一种交际符号和信息传播方式。[1]从原

始人的结绳为字到计算机屏幕文字显示与打印,都确切证实了人类的任何信息,都能

够用文字来传承。没有计算机之前,中国的文字长期以来都是和书法融为一体,人

们工作、学习、生活都与书法休戚相关,书法随文字的应用而传播,有广阔的社会

基础。但是当前由于各类电子信息交流普遍使用功能性的字体(人为的扭曲!),书法

文字在网页浏览、屏幕阅读、手机信息交流中被遗弃,加之国人都用西方

Windows等操作系统,西方网络文化趁机强势入侵,“在全球化西化一体化的文

化偏见中,东方境界正在被不断贬抑和自我轻视,进而在当代生活中与西方流行文

化相比似乎无足轻重。”“书法广阔的社会基础正在消失,中国书法的文化共识正

在破裂。”[2]中国书法的文化自信受到严峻挑战!

我们要正视西方网络文化的问题,迎接挑战,解决当前电子信息交流缺失书法文字

的问题,其关键在于设计出有书法艺术含量且符合国家语言标准、能与世界电子文

字信息交流相匹配的书法字库、词库和作品库,提高其在电子信息交流中的应用与

管理水平,从而找回正在消失的“书法广阔的社会基础”,让所有的电子信息交流

都披上书法的神采韵味(这就是书法字库的力量!)。诺贝尔奖得主杨振宁教授在

《中国文化与科学》的演讲中,认同“中国文化核心的核心,是书法”这一观点[3]。

我们不能因为电子信息交流缺失书法而使我们的后代对自己的“核心文化”失去信

心和传承!

2 书法字库的设计制作

书法字库是指按某一书法特征集成起来的书法字体,进行字形提取,拟合生成统一的

风格、符合语言文字编码标准(如GB2312-80)的连续性图形索引文件。当前我国

书法字库数量少、应用范围窄,还存在诸多问题: ①没有作为操作系统默认的书法

字库,缺少作为正文字体使用的书法字库。②对古代经典书法作品分割处理生成字

库后,无法再现书法的行气、章法及神采韵味,变形变味严重。③现行字库对书法字

形无限组合后产生的联属关系、形态大小、位置变化、笔画飞白、力度、墨色润燥

等的艺术特征尚欠技术支持。④图像字体缩放造成字体变形,影响美观,字体屏幕显

示机械、呆板,缺乏书法韵味。⑤网络和手机中文信息浏览缺乏书法字库支持,中国

书法文字在电子信息交流过程中被边缘化且面临失传的危险!如图1所示:瘦金体

字库排版作品与宋徽宗书法原作比较图。

图1 瘦金体字库排版作品与宋徽宗书法原作比较图

书法艺术要求书法字库输出的字形具有审美形式的随机性、多层次深远韵味、广阔

深邃的意境和书法艺术家的人性化展示。这些都需要针对书法字库进行自适应开发

设计才能实现。笔者试用书法艺术标准和当前字库设计专业软件、精细人工处理和

字体引擎、字体脚本自动选型等技术相结合,利用特殊的工艺流程来设计,力求实现

书法字库的实用功能与视觉传达的艺术效果相统一,在Windows系统中实现的书

法字库、书法词库、书法作品库,可以在办公、排版、图形等软件输入文字后进行

排版编辑出书法篇章或书法作品。

如图2所示: 书法字库、词库、作品库的设计实现与管理流程图如下:

(1) 书法字模的选取与创作。

传统的字模亦称“铜模”,本义是指铅活字的模型、母体。字库中的字模是指用二

进制代码在电子存储设备中存放的索引图形数据。这里的书法字模有两种形式,一

种是按书法的审美规则创作的纸质书法稿或历代书法家经典碑帖,称为纸质书法字

模;另一种是把纸质书法字模通过输入设备转换为电子信息设备可识别的通用代码,

形成二进制书法图像数据,称为数字书法字模。数字书法字模按一定规则拟合集成

书法字库,通过信息输入输出设备进行分类、比较、检索、传输、显示等处理,即

可将书法字模的内码转换为人们可识别的书法文字。制作书法字库、书法词库和书

法作品库,要借助书法典籍,精选一家经典书法作品作为纸质书法字模来制作数字

书法字模;创作的书法字模要按书法规律及汉字编码表所例的文字个数来创意,可

用笔在纸上书写,全部字模都应用统一的风格来创作,要求字形统一、笔画规范且有

书法神采韵味,例如,按GB2312-80编码表来创作书法字模共需书写近7 000个

汉字。

制作书法字模时还要注意与其他文种的字符相匹配,这些字符都必须用统一的书法

规则来设计创作,如阿拉伯数字符、英文字符等纸质字模。

(2) 纸质书法字模二值化处理与数字书法图像切分、边缘检测和修复。

把创作或选取的纸质书法字模稿分页扫描转换为数字书法二值图像,“然后将原始

二值图的数据矩阵存储为可识别外轮廓的矩阵, 即边界轮廓的二值图的数据矩阵。”

[4]

图2 书法字库、词库、作品库的设计实现与管理流程图

对数字书法字模整页图像的切分是采用行字切分算法,书法字形点阵区域在直方图

上呈现出波峰状,沿字符间的空隙来切分成单个书法字形。“整个页面切分过程主

要可分成初步切分、部首块合并、噪声块剔除、粘连书法字切分四步。” [5]

由于书法作品书写力度不均匀,字与字之间有连笔、笔画有浓淡粗细和走势有呼应,

字体造型有联属关系,会导致经常出现一些局部灰度变化过快的情况,为了解决这一

问题,应实行单字或部件套框切分,把具有共性的部件切分出来以备拟合同一个字

的不同造型,有利于建库时的首字模、尾字模的自动选型配对。接着将切分出来的

单个书法图象比照纸质书法字模中所蕴含的鲜明的、人格化的书法韵味进行修复。

特别是书法行草书中的飞白、印印泥、随机抖动和压感的人性化风格特色等。在这

一环节要进行精细人工设计,要将位图转换成曲线轮廓,对其轮廓的位置和边界上

的关键点进行手工调整。使之与纸质书法字模原作尽可能保持一致。从而为下一步

书法字曲线轮廓的生成提供高质量的图像数据。

(3) 数字书法字模曲线轮廓描述与编码。

将二值化切分的数字书法字模图像导入到曲线轮廓造字软件中(如Type light、

FontCreator等)生成曲线轮廓书法字模。这些生成的书法字模曲线轮廓整体特征

和局部特征是由许多关键点来控制的,要使书法字模保留原书法字形的笔锋信息,就

要对每一个书法字形都施加一组具有统一书法特征的效果,则应用有理Bezier曲线

增加可调节的权重来调整关键点位置的参数,同时对控制失真处的关键点施加精细

手工调整,主要是对曲线轮廓上直线控制点、弧线控制点、尖点、转折点、拐点、

交叉控制点、粘连产生的凹点和重合点的曲直、角度和位置进行调整,以实现更近

似于书法特征的曲线轮廓。如图3所示,王羲之兰亭序“永”曲线轮廓字模。

图3 王羲之兰亭序“永”曲线轮廓字模

“永”字边缘处的若干个小方块为书法字模的封闭轮廓线上的关键控制点。将生成

的曲线轮廓书法字模依据GB2312-80汉字编码标准,“按照和现代汉字的对应文

字进行编码,内码和现代汉字相同。” [6]给出编码,拟合生成TrueType格式的

字库文件。然后引入OpenType字形技术进一步精确定义每一个书法字模轮廓来

完美体现书法字体的整体风格特征。

3 应用OpenType字形技术处理书法字库的特殊性

设计制作OpenType书法字库的关键是提炼出书法字库具体艺术特征,并通过

OpenType脚本语言描述来再现书法字库这些特征。OpenType是一个开放源代

码的字形描述技术,之前就已出现了TrueType(简称TT)字形技术, OpenType是

由Microsoft和Adobe公司联合提出的一种曲线字形描述技术,它是在TrueType

基础上的功能扩展。OpenType字形技术是一种用彩色数字函数描述字体轮廓外

形的一套内容丰富的指令集合,这些指令中包括字型构造、颜色填充、数字描述函

数、流程条件控制、栅格处理控制器,附加提示信息控制等指令。应用OpenType

字形技术,为书法字库添加连笔、行气、章法、风格等脚本,能确保按照输入的文

本来编辑出符合书法标准的作品,并能在计算机软件中正确显示与打印书法字库。

这就必须把书法的相关特征写入每一个字模文件中。笔者主要是使用OpenType

字体布局工具VOLT(Visual OpenType Layout Tool)来设计编写脚本。通过

VOLT打开书法字库文件,按照软件的菜单提示分别添加书法字库基本控制信息、

输入脚本语言名、创建默认语言、添加书法字库的具体特征脚本;还可以通过高级

字体编辑器如Type light和FontCreator来设计。

(1) 添加书法字库基本特征脚本。

书法字库基本特征主要有字符造型、字形占位、字距、纵向和横向中线和基线等等,

不同的书法字体有不同的总体特征。如行草字形占位忽大忽小,对每一单个书法字

体都要设置纵向和横向起始基线,篆书字形修长,字形竖向占位是楷书的两倍。笔

者主要通过FontCreator字库制作软件的复杂字形转换脚本编辑工具来添加以下

脚本,实现书法字库的基本特征: ①字符和字形几何占位、分解组合特征

(Characters and Glyphs);②字形轮廓移动、角度、比例、正反、折转等规则

(Outlines);③字形左右、上下轴线、宽度、中心指标(Metrics);④字形正斜、粗

细、凹陷、随机点变动影响效果(Effects);⑤其他脚本扩展和增加描述, 提示其他

有价值的信息等(Other)。通过以上特征脚本的添加实现书法字库的智能化输出,

如图4所示。

图4 复杂字体脚本添加工具窗口示意图

添加以上脚本之后,还必须再利用OpenType字形技术的开源性进行二次开发来

添加随机自动生成符合书法风格特征的书法连笔、行气、章法、风格等脚本,才能

较好地实现在支持OpenType字形技术的电子设备中正确显示与打印书法字库。

如图5所示, 添加了OpenType布局表描述书法基本特征的中文书法艺术字库瘦

金书楷体繁体在Word 2003的排版稿。

(2) 添加书法字库笔画、结体特征脚本。

图5 添加了OpenType布局表描述书法基本特征的中文书法艺术字库瘦金书楷体

繁体在Word 2003的排版稿

书法字库的笔划特征主要是笔划形态特征、 轮廓形状特征、笔画走势特征。“笔

画形态特征包括抖动度、笔压变化度、笔画曲势等特征,结体特征则包括形状特征、

重心特征和几何矩分布等特征。”[7] 笔画形态的具体造型特征由书法字库中全部

单个字模的点与线的粗细、长短、曲直、俯仰、向背、飞白、浓淡、刚劲、圆润、

挺拔等表现出来;结体造型的具体特征由其笔划组合的相交、相接、相离、方圆、

平稳、险绝、中宫缩放、左右结构、左中右结构、上下结构、上中下结构、半包围

结构、全包围结构、混合结构等表现出来。主要通过OpenType 布局表添加相应

的书法字库笔划、结体特征脚本。其中GSUB表可用于定义书法字体笔画的走势

规则,同时还提供了一系列的复杂文本处理的基本控制功能,如对字形笔画形态的

调控等;GPOS表用于定义字形位置的控制信息,如单个书法字形的配对和位置调

整、字形结构形状调整、字体纵向与横向灵活变形以及其他各类字形共性规则定义。

(3) 添加书法字库自动选型脚本。

在进行文本编辑时,随着后续字符的输入,前面已经输入的字符的显现形式也要发生

变化,将书法字体的某一种形状替换成另一种形状更适合的字体造型叫作自动选型。

通过编制书法字库自动选型脚本,解决书法字形之间随机组合的体势联属和变形显

现问题。添加书法字体单一替换、多字替换、变形替换、连字替换、前后、上下字

形联属替换等脚本,如行草书的一个节奏行中的字形有大小和墨色鲜涩、浓淡变化;

最末一个字的最后一笔可伸长或昂扬等变形。

这些变型显现形式主要有四种: 节奏行中的首字、过渡飞白字、尾字笔画伸展、

尾字笔画昂扬。要充分考虑全部可能的组合,例如一个节奏行的首字较大且墨色较

浓,第二字与第三字有联属关系,尾字字形较大且笔画有飞白或笔画伸展。在编制自

动选型脚本时,主要以书法造型特征为主,对字形间的联属关系,整篇字的行气与章法

要兼顾考虑。这些自动选型脚本的添加是通过 OpenType 的(GSUB)字型替换表的

单一替换规则来完成书法字形替换自动选型的,是以字母的独写型名义字符的编码

为基础,编写出名称字符配对的4种变型显现形式的代码。如图6所示,添加书法

自动选型脚本后在Word 2003排版的空心效果硬笔书法作品横式选形示意图。

图6 添加书法自动选型脚本后在Word 2003排版的空心效果硬笔书法作品横式选

形示意图

(4) 添加书法字库的连笔组合脚本。

现代的硬笔书法行草书以横写连笔为主,大都是前一字的收笔与后一字起笔相接或

笔断意连,成横式走向;传统的毛笔书法是从右向左竖写,上一字的收笔与下一字起

笔相接或笔断意连,成竖式走向。要根据硬笔书法与毛笔书法的特征来选择连字组

合特征,在输入可连笔的字体时,书法字库即会自动变成连字;也可以归纳出多组连

字书法词组单独设置键位一键输入(笔者已归纳出8621组硬笔书法行草横式连笔

词组、6977组毛笔书法行草竖式连笔词组)。主要通过OpenType的布局表

(GSUB)中的连笔替换规则来设计字与字之间的连笔替换,建立GSUB表的

Ligature属性脚本,添加上一个书法字收笔与下一字起笔相对接的位置控制代码

来实现书法字形输出时的连笔效果。也可添加Ligature属性脚本实现前一字与后

一字的字形体势联属,或利用书法词库中的两字连笔或多字连笔替换,使书法字体

的行与列连贯有生气。如图7所示,添加书法连笔组合脚本后在Word 2003排版

的王铎赠张抱一草书诗卷、邱明锋硬笔书法作品连笔组合示意图。

图7 添加书法连笔组合脚本后在Word 2003排版的王铎赠张抱一草书诗卷、邱明

锋硬笔书法作品连笔组合示意图

(5) 添加书法章法组合脚本。

在VOLT中通过添加字形替换检索和多重基线、行间距调整、风格化字间距调整

等特征脚本,能使书法字库、词库、作品库等输出的书法字体具有整体章法。即通

过VOLT的字形布局表GDEF来于定义书法字体编辑输出时的单字定位选形脚本;

用BASE表给出每一个书法字模的基线和扩展数据的范围;用JSTF表来调整书法

章法版面特征,就可以实现在支持OpenType字形技术的电子设备中正确显示与

打印出有章法的书法字库排版作品。

如图8所示,添加了书法章法特征的篆、隶、楷、草、行书法作品库在Word

2003中的排版作品。

(6) 添加书法字库的风格特征脚本。

在书法字库创建过程中,对每一个书法字模的特殊性都要拟合2至5个不同造型,

充分考虑到每一个书法字体在行与列的不同位置形成的不同造型,同时借助书法典

籍博采众家之长创意出统一的书法风格特征。常见的书法风格特征有:简单几何常

量、形状签名、轮廓矩、多尺度空间、形状上下文等。[8]书法风格特征是拟合书

法字库的关键,是指书法作品整体上呈现出来的某些代表性特征,表现为书法家鲜

明的个性、时代性(如晋人尚韵、唐人尚法、宋人尚意等等)和不同地域的差异性

(如北书以骨胜,南书以韵胜等等)。通常有以下几种不同类型的书法风格: 朴茂高

古、秀润丰膄、苍劲雄浑、方峻凝重、雄强浑厚、清新劲挺、天真精妙、静穆深邃、

宽博俊逸等等。主要用可视化的VOLT脚本编辑工具添加书法字库的风格特征。

具体操作是通过VOLT软件打开TrueType书法字库文件,按流程分别操作: ①在

ScriptList添加书法字库语言标识符和风格特征描述信息;②在FeatureList表里添

加书法字库形状签名、形状上下文的特征信息;③在LookupList表添加书法字模轮

廓矩、多尺度空间替换特征相对应的替换规则。

图8 添加了书法章法特征的篆、隶、楷、草、行书法作品库在Word 2003中的排

版作品

上述三步操作完成后,再通过EditGlyphs选单查看字库的位置号,通过

EditLookup选单分别编辑首字符、独体字、中间过渡字

行尾字、连笔字、基于风格的替换形式等组合成行、成段、

成篇的书法风格脚本。脚本添加制作完成后点击Compile和Save按钮保存确认

完成,就形成了带脚本的完整的OpenType书法字库。

4 书法字库测试

对设计的书法字库还要经过严格的质量检验,一个字、一个字地查,甚至一个点、一

个点地看,每一个字都要做得好,既要字形轮廓有书法韵味、结构符合书法规律,还有

一整套的技术规范,例如要在字体曲线的最远端加一个极值点、每一个笔画要以最

少的关键点进行描述,以尽可能减少存贮信息,提高书法字库调用时的还原速度等等。

将书法字库直接安装到Windows XP以上版本的操作系统后,可以在Word等编辑

软件中直接输入常用字体,然后选择该书法字库进行测试。例如可以连续输入三行

汉字,可以看到每个书法字形的笔画和体势呼应联属关系,看到整行字体的行气,多行

字体的整篇章法和风格特征。一个节奏行的首字墨色显示较浓、第二个字造型与首

字有联属关系,中间的字形大小、尾字的笔形变化也能表现出来,这样代表了书法字

库自动选型脚本设置正确;进行连字组合脚本测试及书法风格特征测试。最后,进

行多种文字与特殊符号混合使用时的中线位置、基线位置、字号大小、线条粗细搭

配测试。测试中发现问题可以通过调整脚本或字模解决。

5 书法字库的管理实现

书法字库的管理集中在两个方面,一是书法字库屏幕显示,为人们提供电子阅读;二

是书法字库的打印,满足一切书报刊和广告印制的需要。以Windows为例,该操作

系统作为全世界使用量最大的计算机操作系统,虽然具有一定的中文字体处理能力,

但其默认字体缺失中国书法文化这是不争的事实。Windows所使用宋体、仿宋体、

楷体、黑体皆为功能性字符,这些字库仅能机械地表示字符本义,并不传达中国书法

的意蕴。要使Windows操作系统的中文处理传达中国书法的意蕴,就必须引入

Graphics Device Interface(简称GDI)图形设备接口,并借助TrueType、

OpenType字体引擎来管理书法字库。主要是通过GDI和字体引擎把书法字模从

一个编码渲染成高清晰彩色曲线轮廓位图。书法字库安装到Windows系统后,其

输出都是通过GDI函数来实现的,GDI将屏幕和打印机视做一块画布,可以在上面作

画,GDI和字体引擎的任务就是通过Bezier曲线将ttf、otf字体数据渲染为彩色位

图图像(bitmap)。通过GDI函数取得ttf、otf字体的曲线轮廓,再给出所需要的字

体、字号,是否斜体、是否彩色等,显示到屏幕上。借助OpenType字形技术“在

Internet的HTML文本中嵌入字体信息作为一种标准机制,同时,提供流线字体管理、

丰富的格式参数,包括字体嵌入式的集成Internet出版环境和基于Internet的应用

管理。”[9]可在Internet平台嵌入书法字库,实现网页浏览使用书法文字体的目标。

要实现书法字库打印输出,必须安装PostScript打印驱动,配置与之相适应的打印设

备,且打印机具有所需要的内存和书法字库。目前Windows等操作系统能较好地

支持TrueType、OpenType字体引擎和GDI图形设备接口,并将一个书法字符从

编码渲染成高清晰彩色位图而显示到屏幕上供浏览或应用程序打印。

6 结束语

本文的研究工作是在大量的书法字库开发实践经验基础上的总结,部分成果已在申

请专利。笔者设计的书法字库、书法词库、书法作品库已在各种系统软件、应用软

件中得到了具体应用和验证。书法字库开发是跨学科的特有技术,其关键在于纸质

书法字模创作和矢量化、字体引擎技术的二次开发和设计。应用OpenType字形

技术的开源性来设计书法字库的特殊性和添加连笔、行气、章法、风格等脚本;探

索了书法字库的管理问题,实现了对应的TrueType、OpenType书法字库屏幕显

示,实现了电子阅读、打印输出所见即所得的书法信息化效果。再结合由GDI和字

体引擎去管理书法字库,可以较好的解决书法字库屏幕显示,打印输出的中文字体

既符合中国书法艺术标准,又能与当前操作系统兼容,使书法字库能广泛应用于网络

出版和广电等领域;进行二次开发也可在手机等电子设备得到应用,为中国传统书

法文化在电子信息交流中更好地得到传承和发展做出了有效尝识。

参考文献

[1] 蔡飞鹰. 浅析书法的四大功能[J].美术大观,2010(1): 16.

[2] 王岳川.“文化书法”的精神底线[J].书画世界,2008,127:25-26.

[3] 杨振宁.中国文化与科学[R],1999年12月3日在香港中文大学新亚书院举办的

“金禧讲座”上发表的演讲.

[4] 曹芳,武仲科,敖雪峰等.启体书法字的矢量化.[J].中文信息学

报.2010.24(6):99.

[5] 俞凯.计算机书法若干关键技术研究[D]. 浙江杭州.浙江大学,2010,27.

[6] 栗青生,吴琴霞,王蕾.基于甲骨文字形动态描述库的甲骨文输入方法[J].中文

信息学报.2012.26(4): 30.

[7] 鲁伟明.书法资源的有效管理和新型服多模式研究[D].浙江杭州.浙江大学,2009,

14.

[8] 鲁伟明.书法资源的有效管理和新型服多模式研究[D].浙江杭州.浙江大学,2009,

14.

[9] 肖明,胡金柱,赵慧.字形技术及OpenType字体文件格式研究[J].中文信息学报,

1999,6: 54.

本文标签: 书法字库字形字体字模