带有表情的字符被分词后,表情的unicode字符对被拆分开了,导致无法完整的统计一个表情,怎么样能让表情不会被拆分开呢? 