盼盼资源网-亲测资源网-盼盼的家园www.panpan.org

 找回密码
 立即注册
查看: 3879|回复: 0

[普通] TextPro v6.5 中文文本批处理软件

[复制链接]

2439

主题

2549

帖子

40万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
408835
发表于 2020-1-2 17:35:44 | 显示全部楼层 |阅读模式
TextPro v6.5 中文文本批处理软件

功能介绍:

简繁体转换
TextPro内部采用Unicode编码。通过读入和保存不同编码的文件可以实现不同编码之间的转换。TextPro可以实现繁体汉字与简化汉字之间的互相转换。
简繁汉字转换牵涉到许多问题,尤以多义字和古今用法中的异体字为难,无法兼顾。TextPro的汉字转换以处理佛经(古代文体)为主,暂未顾及现代汉字特点。
TextPro对汉字处理的原则是:一是遵循我国现有的汉字标准;二是兼容全部BIG5码汉字;三是采用多层次的转换功能(如果文本行末有硬回车,宜使用TextPro的“删除换行”功能进行预处理)。后者是指除了一对一的汉字转换外,在内部转换时还采取了以词组选择多义字的方法以尽量减少转换错误;不过,要想在转换后得到完全正确的文章,仍须逐字校对。
在将文件保存到Big5编码时,可以用异体字和组字式替代Big5编码不支持的汉字。在设置->选项中可以设置是否“转成异体字”和“转成组字式”(默认为勾选转换)。
TextPro在汉字转换之外还提供了一个补充功能:可以用自定义替换表进行汉字的替换。用法在“正则表达式和自定义替换说明”的帮助文件(RegExp.chm)中有介绍。
简繁互转中解决了部分一对多的难题,但对复杂情形和古文还不够用,只能起到辅助作用。
在简繁互转的选项中有“下列括号对内的文字不转换”的框,如果写上[],则正文中被[]括住的文字不参与转换。有些长文本后半截未转换,经常是文中有[而无]所造成的情况,不需要此功能的人可删除选项中的[]或其它括号对即可。



强化的查找/替换功能
TextPro推出支持Unicode的正则表达式替换、自定义替换、批量自定义替换功能。其特点是在通用英文正则表达式的基础上强加了自己创造的中文正则表达式,例如它可匹配GBK字集、BIG5字集、以及中文数字、天干地支等。
通过适当的组合,可以完成的查找/替换功能几乎是无限的。由于此功能比较复杂难学,详见“正则表达式和自定义替换帮助文件”(RegExp.chm)。
TextPro在普通查找和正则表达式查找时都支持忽略回车和标点符号的选项,为查找不同版本的佛经以及网页文件提供了便利。

文件比较
能够直观对比两个文件内容异同的软件极罕见。TextPro可以在窗口中打开两个或三个文件,在“窗口”菜单选择“平铺”,用鼠标分别单击每个文件内容中相同的启始位置,然后连续按键盘上的“F5”按键开始比较。
发现不同字符时,程序在下方状态栏提示不相同的字符及其位置,当前激活的文件中,光标自动移到不相同的字符处,以便直接编辑,未激活文件窗口的显示位置自动随之移动。
比较时自动忽略回车和半角空格,还有“忽略全角标点符号”和“忽略半角符号”的选项可供选用。
如果在比较中失去正确的位置对应,请分别在两个文件中重新设定往下比较的起始位置。
TextPro6比以前的版本增加了“忽略异体字”的选项,包括:
忽略异体字(完全等同)
忽略异体字(包括部分等同)
不忽略异体字
“完全等同”指音义全同的异体字,例如:“兔兎”。
“部分等同”指部分相同的异体字,例如“奔犇逩”。
“不忽略异体字”是最严格的比较方法,但比较速度较慢。

合并文件
TextPro能实现Windows环境中比较完善的文件合并功能,有两种合并文件的操作方法:
一是手工合并文件:单击“文件|合并文件”,选择文件,排序,填好合并后的文件名,然后单击“合并”;
二是自动合并文件:对有规律的文件名可以使用正则表达式匹配要合并的文件。例如有若干文件,格式为001_001.txt、001_002.txt……、002_001.txt、002_002.txt……,可以单击“文件|自动合并文件”,对其中的源文件输入正则表达式“(\d+)_(\d+)\.txt”,目标文件名为“\1.txt”,排序关键字为“\2”,则所有以001开头的文件合并为001.txt,以002开头的所有文件合并为002.txt。



批处理
除了“文件比较”功能之外,TextPro可以同时对多个文件进行批处理,支持多层目录操作和文件备份。
批处理的方法是从“文件|批处理”命令或工具栏上的快捷键启动批处理窗口,然后
(1)点右侧的“文件”按钮选择需要批处理的目录或多个文件;
(2)从左下框中选择功能;
(3)选择到右侧框;
(4)根据需要设置“输入编码”和“输出编码”,点“选项”或“查找/替换”键进行细致设定;
(5)最后按“处理”键。
自定义替换的功能需要先在TextPro中设定,然后再进入批处理窗口。
“输入编码”是输入文件的编码,如果选“自动选择”就自动检测文件编码。请注意自动检测编码不是百分之百正确的,有可能判断错误。“输出编码”是输出文件的编码,如果选“自动选择”就保持输入文件的编码。如果选择不同的“输入编码”和“输出编码”就可以达到转码的目的。
如果用户仅需要文件转码,可以从左下框选择“转码”处理。如果已经选择了其它处理,就没有必要再选择“转码”了,TextPro会自动按“输出编码”保存文件。
TextPro仅改写变化的文件,如果用户选择了“建立后备文件”,在改写前会先备份文件。不需要改变的文件保留原来的修改日期。

删除半角字符
点“转换”菜单中的“删除半角符号”命令或其工具栏上的快捷键,可删除字母、数字、连续半角空格、或其它半角符号。此项功能需要在“设置|选项”命令或工具栏上的快捷键中设定。如果你要删除全部半角符号,请在最上一个选项打勾,否则进入下面的子项选单。
选单左面有三个单选项。当选中上面两个单选项时,下面的小输入框内可输入一些半角符号,然后选择“删除所输入的符号”或者“删除输入以外的符号”;如果是与输入符号无关的话,请选左面第三项,然后再选是“删除字母”、“删除数字”还是“删除多余空格”。
“删除多余空格”允许用户填写保留几个连续半角空格。超出指定数量的连续空格会被删除。


字符的半角/全角转换
“转换”菜单的“转全角”的命令可以将半角的标点符号转换到全角,转换时两个半角空格被转换成一个全角空格,默认情况下单个半角空格会被转换到一个全角空格。这个命令有两个选项:“转换半角字母数字”和“单个半角空格不转换”。
“转换”菜单的“转半角”命令把全角字母、数字和标点符号转换成对应的半角字符,一个全角空格会被转换成两个半角空格。此项命令没有选项。


规范行首和删除行末空格
点“转换”菜单中的“规范行首”命令或其工具栏上的快捷键,可使选择段落或全文的每段以两个全角空格开始,符合中文文件的规范。还可在选项中设定以哪些字符开始的段落不进行规范行首。
空行不会被增加全角空格。全是半角空格或全角空格的行会被删空。
删除行末空格是消除某些超文本文件在行末的半角和全角空格。有些网页或论坛会在行末增加的半角字符干扰码甚至加上规则的汉字,则本功能无效。不过可以用正则查找/替换来对付。


删除段内回车
在实际工作中可发现许多文本文件在段落中间的行末都有硬回车,不符合有些文本文件的要求。“删除段内回车”是为了解决这个问题而设计的。
点“转换”菜单中的“删除换行”命令或其工具栏上的快捷键,可删除段内各行末尾的硬回车。
默认情况下,以半角空格或全角空格开始的行被认为是段开始。其它回车都被认为是段内回车而删除。
此功能有两个选项:“保留连续换行”,“新段以双空格开始”。选择“保留连续换行”后,连续两个及以上回车也被作为段分隔符。选择“新段以双空格开始”后,只有两个全角空格或4个全角空格开始的行才被认为是段开始。其它回车都被认为是段内回车。
注意:有些此类文本的段首没有空格而段落之间又没有空行,则需要手工在段落前加一回车或规范行首。


按行排序和删除重复行
TextPro实现了按行排序并删除重复行。两个功能是独立的,以满足需要删除重复行又要保持行序的用户。


按行排序
点“转换”菜单中的“按行排序”命令或其工具栏上的快捷键可以按照当前选项排序。目前的排序原则是按电脑默认的次序,以后将增加按拼音和笔画排序。


删除重复行
点“转换”菜单中的“删除重复行”命令即可删除重复行。对于重复的行仅保留第一次出现。


杂项功能
以下几项杂项功能也是在碰到实际需求后设计的:
设置快捷键和自定义工具栏
用户可在“设置”菜单中将程序固定功能和自定义替换表都设置成相应的快捷键(如下图)和自定义工具栏,以满足各人的特殊需求。


设置程序
在菜单中依次选择“设置-选项-程序”,其中有四个选项:
1.“允许运行多个TextPro”,勾选后可打开多个会话(推荐),而不勾选则只能在一个程序中打开多个TXT;
2.“粘贴时自动剔除论坛干扰码”(不推荐使用),适用于简单的论坛干扰码,但也可能造成部分html的tag剔除不净,请慎用;
3.“集成到右键菜单”,适用于未将TextPro关联到txt文件时;
4.“文件关联”(包括关联图标),可选用TextPro关联txt文件并选择图标。


重新载入
在“文件”菜单中。适用于TextPro自动识别文本内码错误(即显示乱码)时,用此功能手工选择内码,重新载入乱码文件。

删除空行
在“转换”菜单中,删除空行功能包括只有半角或全角空格的空行。

段间空一行
在“转换”菜单中,有些用户喜欢这种排版。与前面“删除空行”相反。

删除重复行
在“转换”菜单中,是编辑输入法或文本处理中的常用功能。

删除行末空格
在“转换”菜单中,可用来删除一些论坛的行末空格。

简单排版
在“转换”菜单中,包括以上删除空行、规范行首、删除行末空格三项功能,是最简单的一键排版功能。

自动分段
在“转换”菜单中,对每行字数十分整齐的文本可以用此功能快速删除行末回车。此功能有三个选项:每行汉字数、段结束符、段开始符。
自动分段的原则是:如果一行由半角或全角空格开始,则视为新段开始;连续两个换行也视为新段开始。否则按选项中设定的每行字数自动分段。

控制行宽
点击“转换”菜单中的“控制行宽”命令或其工具栏上的快捷键,可按选项中设定的半角字符数换行,并在每行末尾加上回车。(注:不能使用半角引号,否则会出错。)

匹配括号
点击“转换”菜单中的“匹配括号”命令或其工具栏上的快捷键,可检查括号、引号的匹配情况,在不匹配时给出错误提示。(注:半角引号在处理中有可能出错。)

括号嵌套转换
在执行上步“匹配括号”后,可以点击“转换”菜单中的“括号嵌套转换”命令或其工具栏上的快捷键,可将文件中多重括号、引号中出现错误之处自动纠正。

半角引号转全角引号
在“转换”菜单中。很多字处理程序处理不好引号,TextPro特增加此功能。

竖排符号横转
在“转换”菜单中。在BIG5码和GBK繁体竖排文章中使用了一些竖排符号,使用此功能可在简体横排汉字文章中将其转成相应的横排符号。

半角引号转全角引号
因为半角引号是不分前后引号的,所以有时希望转为全角引号以更适合国人需求。这个功能正是为此设计的。

按行排序
在“转换”菜单中。在编辑输入法等操作中经常需要按行排序以处理相邻行的文本处理,所以设计了简单的按行排序。并特意与“删除重复行”的操作分开,以适应不同需求。

字数统计
在“查看”菜单中,可分别进行三种统计,即普通的字数统计、统计选定文字出现的次数、统计段落数。

转到某行
在“编辑”菜单中,可手工输入转到某行。

打印
提供打印、打印预览和打印设置的功能。


TextPro v6.5 中文文本批处理软件:
https://545c.com/file/4000752-415886746


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|民间故事|新华字典|周公解梦|实用工具|加密解密|便民服务|盼盼工具箱|闹钟|默笙工具箱|易经风水|Archiver|手机版|小黑屋|盼盼资源网

GMT+8, 2022-5-17 23:22 , Processed in 0.221440 second(s), 20 queries .

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表