__construct() __construct( $source_charset = 'utf-8', $target_charset = 'utf-8', $load_all = TRUE, $source = '') : void 构造函数 Parameters $source_charset $target_charset $load_all $source
SplitWord() SplitWord( $source_charset = 'utf-8', $target_charset = 'utf-8', $load_all = TRUE, $source = '') Parameters $source_charset $target_charset $load_all $source
GetWordInfos() GetWordInfos( $key, $type = 'word') : \short 从文件获得词 Parameters $key $type (类型 word 或 key_groups) Returns \short — int
SetSource() SetSource( $source, $source_charset = 'utf-8', $target_charset = 'utf-8') : boolean 设置源字符串 Parameters $source $source_charset $target_charset Returns boolean
SetResultType() SetResultType( $rstype) : void 设置结果类型(只在获取finallyResult才有效) Parameters $rstype 1 为全部, 2去除特殊符号
SetWordInfos() SetWordInfos( $word, $infos) : \void; 指定某词的词性信息(通常是新词) Parameters $word $infos Returns \void;
StartAnalysis() StartAnalysis( $optimize = TRUE) : boolean 开始执行分析 Parameters $optimize Returns boolean
_deep_analysis() _deep_analysis( $str, $ctype, $spos, $optimize = TRUE) : boolean 深入分词 Parameters $str $ctype $spos $optimize Returns boolean
_deep_analysis_cn() _deep_analysis_cn( $str, $lastec, $spos, $slen, $optimize = TRUE) : void 中文的深入分词 Parameters $str $lastec $spos $slen $optimize
GetFinallyResult() GetFinallyResult( $spword = ' ', $word_meanings = FALSE) : string 获取最终结果字符串(用空格分开后的分词结果) Parameters $spword $word_meanings Returns string
GetSimpleResultAll() GetSimpleResultAll() : \array() 获取粗分结果,包含粗分属性(1中文词句、2 ANSI词汇(包括全角),3 ANSI标点符号(包括全角),4数字(包括全角),5 中文标点或无法识别字符) Returns \array()
GetFinallyIndex() GetFinallyIndex() : \array('word'=>count,...) 获取索引hash数组 Returns \array('word'=>count,...)
MakeDict() MakeDict( $source_file, $target_file = '') : void 编译词典 Parameters $source_file $target_file