1.רҵ?专业专业ʿ?Դ??
2.jcseg功能特色
3.Python 结巴分词(jieba)源码分析
4..md文件是什么?.md如何打开?-搜狗输入法
5.Elasticsearch7.8.0集成IK分词器改源码实现MySql5.7.2实现动态词库实时更新
6.Friso功能特色
רҵ?ʿ?Դ??
自动修改/翻新/混淆/OC/iOS代码,自动替换类名,词库词库方法名
由来
网上有很多关于如何混淆iOS源码的源码源码方法,但是下载都不够智能,生成的专业专业方法类名要么千奇百怪,要么aaaabbbxxx这种完全毫无意义的词库词库匿名打分源码名称,要么只能修改单个文件,源码源码多个文件根本无法关联,下载我就想有什么方法可以像真人一样去修改源码,专业专业符合语义,词库词库不是源码源码胡编烂造的方法名,还可以自动修改相关联的下载文件, 还能自己自定义单词库,于是专业专业就有了这个工具。
演示视频
划重点
1. 该工具可以让你一键翻新代码,词库词库但是源码源码不是生成完整的xcode项目,需要你自己新建一个xcode项目,然后把翻新的文件拖入到新的项目中。
2. 该工具只要是ipa都可以,不限制OC,Swift,Flutter,React Native,H5类app。
3.目前免费使用,免费使用,免费使用,重要的事情说三遍
几个效果展示
使用说明
下载项目,官网下载:IpaGuard官网--IOS 应用程序ipa文件混淆加密保护工具注意:说明中提到的路径均为绝对路径,提到的逗号,都为英文逗号。使用工具运行成功后,需要自己新建OC项目再将修改后的代码与资源文件拖入新建的工程。功能说明:
未来可能添加的功能:说明文档会不定期更新,如遇到问题先检查是否依照说明文档的定义进行配置。
1. 源文件路径/import_path(必选)
OC项目文件路径包含代码文件与资源文件
如下图
2. 导出路径/export_path(必选)
OC项目导出路径。呆呆快递源码
注意,本工具并不能帮你生成完整的OC项目,只会生成OC代码文件和复制修改项目内部的资源
3. 直接复制的路径/copy_only_pathes(可选)
直接复制,忽略的文件名,多个路径以,逗号隔开
4. 直接复制的文件名(不包含后缀)/copy_only_names(可选)
直接复制,忽略的文件名,不包含后缀
例:UISheetView.h 只需要输入UISheetView,多个文件用, 逗号隔开(注意全半角,逗号为英文逗号)
5. 不进行修改的文件或文件夹/no_change_pathes(可选)
深度读取,但是不会进行更改,如果引入了其他修改了的类,会相应的修改深度读取(说明):会读取文件内部的类比与项目内其他类进行关联例:xxxx/Classes/Models 不想修改,则输入这个文件夹的绝对路径, 如只输入Models,则所有包含名为Models的文件或文件夹都会标记为只读取不修改,多个文件和类用, 逗号隔开(注意全半角,逗号为英文逗号)
6. 不修改的文件或类的前缀名(区分大小写)/no_change_class_prefix_names(可选)
例:不想所有以MJ开头的类或文件,则输入MJ, 多个文件和类用,逗号隔开(注意全半角,逗号为英文逗号)
7. 不修改的文件后缀名(区分大小写)/no_change_class_prefix_names(可选)
如第六条。Model,Info -->不修改以Model,Info为结尾的文件或类
8. 只修改类名的文件名或类名/only_change_clsname_names(可选)
深度读取,只修改类名,不修改内部属性与方法,这个优先级最低,如果之前的条件包含了本参数中的路径,则不生效
9. 只修改类名的文件夹/文件路径/only_change_clsname_pathes(可选)
深度读取,只修改类名,不修改内部属性与方法的文件名,这个优先级最低,如果之前的条件包含了本参数中的路径 则不生效
. 动词词库路径/verbwords_path(可选)
提供单词数组json文件路径 修改的命名逻辑为ABAB型,A为动词,B为名词,例:getMessage
. 名词词库路径/nounwords_path(可选)
提供单词数组json文件路径 修改的命名逻辑为ABAB型,A为动词,B为名词,例:getMessage
. 类名前缀/class_prefix(可选)
给每个类添加的抄底紫金源码前缀例:MJExtension-> MJ 为前缀, SD_ScrollView-> SD_ 为前缀
. 属性名前缀/property_prefix(可选)
给每个属性添加的前缀例:property(nonatomic, strong) UIViewMJView-> MJ 为前缀, property(nonatomic, strong) UIView SD_View-> SD_ 为前缀
. 需要过滤的方法路径/filter_methods_path(可选)
把你需要过滤的方法写入一个文本文件,然后将该文本路径填入到此项输入框注意事项:其他说明:本工具已经过滤了大多数常用系统方法,大部分情况下不需要配置此项。
. 类名和属性名后缀路径/property_subfix_path(可选)
给每个属性添加的后缀,需要一个配置json文件路径json格式:注意:key一定要与上面一直,否则系统无法读取,工具会遍历数组,为对应的类匹配后缀,在配置改文件时,包含相同字符串的类,需要将类名更长的类放在前面,不然匹配结果会达不到预期。例如:UITableView与UIView,配置时需要将UITableView放在View之前,如上面的例子。
. 为方法名添加介词/add_preposition(可选)
工具内置了所有介词,可选择性添加例:getMessage添加介词后-> getAMessage or getTheMessage具体介词完全随机添加
. 修改分类/change_category(可选)
工具会自动识别分类,可选择是否修改
. 将原代码行作为注释写入/add_original_comments(可选)
由于本工具不保证修改后百分百不报错,将修改过原属性声明和方法名作为注释写入,方便在重建工程后报错与原工程进行对照,建议设置
. 修改方法内部局部变量名/change_local_property(可选)
定义在方法内部的局部变量,可选择是否修改
. 综合配置路径(可选)
json配置文件路径,内部必须为字典,key为说明条目标题后面的英文请注意:配置文件优先级高于输入框输入的规则,配置文件存在时, 输入框输入的配置不生效例:(可直接复制修改)
关于bug
虽然工具本身经过了完整的商业项目的考验,但由于每个人的代码风格不一样,工具不可避免会出现解析不了的情况,开发者建议过滤C语言的文件,与第三方库,减少出错的可能性,还是无法运行成功,你可以发isssue至客服邮箱或根据报错Log自行删减项目文件,回复系统源码其中利弊,自行斟酌。
jcseg功能特色
jcseg以其卓越的性能和丰富功能备受瞩目。首先,它采用了四种高效的过滤算法,使得分词的准确率高达.%,确保了文本处理的精准性。
该工具支持用户自定义词库,用户可以在源码中的lexicon文件夹中方便地添加、删除或修改词库内容,并且词库分类明确,便于管理和使用。词库内容整合了《现代汉语词典》和cc-cedict辞典,为词典中的词条标注了拼音,同时也尝试依据《中华同义词词典》标记同义词,但这项功能尚在完善中。通过调整jcseg.properties配置,用户可以决定是否在分词结果中包含这些信息。
jcseg对于中文数字和分数的识别尤其强大,如"一百五十"和"四十分之一",会自动转换为阿拉伯数字(, 1/)并包含在分词结果中。此外,它还能够识别中英混合词,如"B超"和"x射线",以及提供更全面的英文支持,包括电子邮件地址、网址、数字、分数、百分比、字母和标点组合词(如C++)。
对于数字单位,如"年"和"五折",桌面导航源码jcseg会识别并转换为""和"5折"加入分词。同时,它具备自动处理圆角/半角、大小写转换的能力,以及识别特殊字母(如Ⅰ,Ⅱ)和数字(如①,⑩)的功能。
在标点和内容提取方面,jcseg能智能识别并提取如"最好的Java书《java编程思想》"和"‘畅想杯黑客技术大赛’"中的标点内容。对于中文人名识别,尽管准确率已达到%以上,但用户可以通过维护lex-lname.lex、lex-dname-1.lex、lex-dname-2.lex来进一步提高准确率。
Python 结巴分词(jieba)源码分析
本文深入分析Python结巴分词(jieba)的源码,旨在揭示其算法实现细节与设计思路,以期对自然语言处理领域感兴趣的朋友提供有价值的参考。经过两周的细致研究,作者整理了分词算法、实现方案及关键文件结构的解析,以供读者深入理解结巴分词的底层逻辑。
首先,分词算法涉及的核心技术包括基于Trie树结构的高效词图扫描、动态规划查找最大概率路径和基于HMM模型的未登录词处理。Trie树用于生成句子中所有可能成词情况的有向无环图(DAG),动态规划则帮助在词频基础上寻找到最优切分组合,而HMM模型则通过Viterbi算法处理未在词库中出现的词语,确保分词的准确性和全面性。
在结巴分词的文件结构中,作者详细介绍了各个关键文件的功能与内容。dict.txt作为词库,记录着词频与词性信息;__init__.py则是核心功能的入口,提供了分词接口cut,支持全模式、精确模式以及结合最大概率路径与HMM模型的综合模式。全模式下,会生成所有可能的词组合;精确模式通过最大概率路径确定最优分词;综合模式则同时考虑概率与未登录词,以提高分词效果。
实现细节方面,文章通过实例代码解释了全模式、精确模式及综合模式的分词逻辑。全模式直接输出所有词组合;精确模式基于词频和最大概率路径策略,高效识别最优分词;综合模式利用HMM模型处理未登录词,进一步提升分词准确度。通过生成的DAG图,直观展示了分词过程。
结巴分词的代码实现简洁而高效,通过巧妙的算法设计和数据结构应用,展示了自然语言处理技术在实际应用中的强大能力。通过对分词算法的深入解析,不仅有助于理解结巴分词的功能实现,也为自然语言处理领域的研究与实践提供了宝贵的洞察。
.md文件是什么?.md如何打开?-搜狗输入法
搜狗输入法,作为业界领先的智能输入解决方案,凭借其强大的词库、智能化的组词功能和用户友好的界面设计,赢得了亿万用户的青睐。无论是手机还是电脑,搜狗输入法都能提供快速、准确的输入体验。现在您可以轻松下载最新版本的搜狗输入法,享受极致的输入新体验。/
可能有些朋友会看到以md为结尾的文件,但是不知道用什么打开。下面就来说一下.md文件如何打开,markdown文件用什么打开。
1、首先来普及一下什么是md文件, md全称markdown,markdown也是一种标记语言。
2、md文件其实可以用常用的文本编辑器都可以打开,例如记事本、EditPlus、sublime等等。
3、用记事本打开,把markdown文件拖到记事本图标上就可以打开 。
4、用 sublime打开方法也一样 ,当然也可以在文件上右击选择打开方式。
5、当然 打开markdown文件最专业的还是markdownPad软件 。左边是源码,右边可以看展示效果。
搜狗输入法官网不仅提供了便捷的下载通道,还为用户准备了详尽的使用指南和贴心的客户服务。通过访问 / ,您将进入一个全新的智能输入世界。无论您遇到任何问题或困惑,搜狗输入法官网都将是您最坚实的后盾。立即点击链接,开启您的智能输入之旅吧!
Elasticsearch7.8.0集成IK分词器改源码实现MySql5.7.2实现动态词库实时更新
本文旨在探讨 Elasticsearch 7.8.0 集成 IK 分词器的改源码实现,配合 MySQl 5.7.2 实现动态词库实时更新的方法。
IK 分词器源码通过 URL 请求文件或接口实现热更新,无需重启 ES 实例。然而,这种方式并不稳定,因此,采用更为推荐的方案,即修改源码实现轮询查询数据库,以实现实时更新。
在进行配置时,需下载 IK 分词器源码,并确保 maven 依赖与 ES 版本号相匹配。引入 MySQl 驱动后,开始对源码进行修改。
首先,创建一个名为 HotDictReloadThread 的新类,用于执行远程词库热更新。接着,修改 Dictionary 类的 initial 方法,以创建并启动 HotDictReloadThread 实例,执行字典热更新操作。
在 Dictionary 类中,找到 reLoadMainDict 方法,针对扩展词库维护的逻辑,新增代码加载 MySQl 词库。为此,需预先在数据库中创建一张表,用于维护扩展词和停用词。同时,在项目根路径的 config 目录下创建 jdbc-reload.properties 配置文件,用于数据库连接配置。
通过 jdbc-reload.properties 文件加载数据库连接,执行扩展词 SQL,将结果集添加到扩展词库中。类似地,实现同步 MySQl 停用词的逻辑,确保代码的清晰性和可维护性。
完成基础配置后,打包插件并将 MySQl 驱动 mysql-connector-java.jar 与插件一同发布。将插件置于 ES 的 plugins 目录下,并确保有相应的目录结构。启动 ES,查看日志输出,以验证词库更新功能的运行状态。
在此过程中,可能遇到如 Column 'word' not found、Could not create connection to database server、no suitable driver found for jdbc:mysql://...、AccessControlException: access denied 等异常。通过调整 SQL 字段别名、确认驱动版本匹配、确保正确配置环境以及修改 Java 政策文件,这些问题均可得到解决。
本文通过具体步骤和代码示例,详细介绍了 Elasticsearch 7.8.0 集成 IK 分词器,配合 MySQl 5.7.2 实现动态词库实时更新的完整流程。读者可根据本文指南,完成相关配置和代码修改,以实现高效且稳定的词库管理。
Friso功能特色
Friso是一款功能强大的文本处理工具,其核心功能特色包括以下几点:
首先,Friso完全支持UTF-8编码,这意味着无论在何种平台下,用户都可以方便地进行编译和使用,无需进行源码修改。加载完万词条后,内存占用稳定在M左右,确保了系统的高效运行。
其次,Friso内置了四种过滤算法,能够实现.%的分词准确率,确保文本的精确处理。同时,Friso提供自定义词库功能,用户可以在dict文件夹中根据需要添加、删除或修改词库和词条,并对词库进行分类管理。
此外,Friso使用了简化版的Java版本jcseg词库,使得用户可以轻松地进行中文文本的处理。Friso还支持中英混合词的识别,如"c语言"、"IC卡"等,极大提高了处理文本的灵活性。
对于英文支持,Friso表现出色,能够很好地识别电子邮件、网址、小数、分数和百分数等英文文本,满足了用户在不同场景下的需求。
同时,Friso支持阿拉伯数字的基本单字单位识别,如年、5吨、斤等,进一步扩展了其应用范围。
最后,Friso能够自动进行英文的圆角/半角、大写/小写转换,提升了文本处理的便捷性和准确性。