网站开发开票内容上海公司注册信息查询网

张小明 2025/12/31 12:57:58
网站开发开票内容,上海公司注册信息查询网,ps怎么做响应式网站布局图,企业大型网站建设要多少钱问题#xff1a; 有一千二百万条url #xff0c;还有1亿1千万的关键词#xff0c;关键词一定出现在某条url的名字里#xff0c;但是关键词不完全和名字相等#xff0c;并且可能一个关键词同时出现在多个url中#xff0c;所有和关键词匹配的url都要列出来 背景#xff1a…问题有一千二百万条url 还有1亿1千万的关键词关键词一定出现在某条url的名字里但是关键词不完全和名字相等并且可能一个关键词同时出现在多个url中所有和关键词匹配的url都要列出来背景最开始没有想到会处理这么多数据果断采用以下最省力的方案半小时测试数据顺利通过果断收钱完工客户拿到脚本跑一下午都没出结果来售后了一顿排查脚本没问题再问数据谁成想有上亿的数据要处理欧麦嘎的要了老命了方案1运行完估计要将近36小时收人家票子了没办法改吧……然后就有了灵关一现的方案2没有任何经验可谈纯纯被逼出来的想法不得不说Gemini 是真好用ql_query就是它给我改出来的顺便夹带点私货我这有Gemini成品号绑定教育机构的50大洋一个售后30天前几天的大规模封号事件我们这一个都没封售后期内封号包换不限制次数方案1第一反映直接把url 拆成map keyurl的name valueurl 然后遍历 关键词遍历map关键词在key里就记录value解析1小批量数据能用但是太慢了每条关键词都要扫描一遍map太TMD蠢了而且对内存占用极大 多线程OOM方案2把url 拆开 name 和url 导入mysql 中并且把name字段建立全文索引CREATETABLEIFNOTEXISTSall_urls(idINTNOTNULLAUTO_INCREMENTPRIMARYKEY,nameVARCHAR(255)NOTNULL,urlTEXTNOTNULL,FULLTEXTINDEXidx_name_ft(name)-- 在这里直接定义全文索引)ENGINEInnoDB;查询语句# 重要的是这里不要使用 select url from all_urls where name like %% 这种会导致全文索引直接失效了效率及其低ql_query SELECT url FROM all_urls WHERE MATCH(name) AGAINST(:search_term IN BOOLEAN MODE) # source_name 就是要查询的关键字search_termf{source_name}params{search_term:search_term}# with db_pool.get_session() as session: 这使用sqlalchemy实现的自己写就的了withdb_pool.get_session()assession:ressession.execute(text(sql_query),params)解析2使用此方案处理时间从方案1 的5个线程运行天级别降低到了单线程运行分钟级别
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

天水市秦州区建设局网站网站维护页面源码

Kotaemon能否用于餐厅菜单推荐?个性化服务设想 在一家繁忙的中餐馆里,服务员刚为一对情侣推荐了招牌辣子鸡。但没人注意到,其中一人其实对辣椒极度敏感——而系统如果能提前知道这一点,本可以避免一场尴尬的用餐体验。 这正是当下…

张小明 2025/12/31 12:55:27 网站建设

乡村建设相关网站关键词优化设计

要求:开源,免费,技术支持 博客:WordPress 开发语言:PHP 数据库:MySQL 功能:导入Word,导入Excel,导入PPT(PowerPoint),导入PDF,复制粘贴word,导入微信公众号内容,web截屏 平台:Window…

张小明 2025/12/31 12:53:00 网站建设

个人作品集网站是怎么做北碚网站建设哪家好

导语 【免费下载链接】grok-2 项目地址: https://ai.gitcode.com/hf_mirrors/unsloth/grok-2 Grok-2 Tokenizer的Hugging Face兼容版本正式发布,通过简化部署流程和提升工具链兼容性,为企业级大模型应用落地提供了关键支持。 行业现状&#xff…

张小明 2025/12/31 12:50:42 网站建设

如何用wampp 做网站重庆公司章程如何查询下载

如何安装 libunifex。 libunifex 是一个 C 库,实现了统一的异步执行模型。以下是几种常见的安装方法: 从源码编译安装 # 克隆仓库 git clone https://github.com/facebookexperimental/libunifex.git cd libunifex # 创建构建目录 mkdir build cd build # 配置和编译STRING20很…

张小明 2025/12/31 12:48:12 网站建设

为何公司做的网站很丑asp网站怎么做301

NCM格式转换神器:ncmdump极速解密指南 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 还在为网易云音乐的NCM加密格式困扰吗?ncmdump这款轻量级工具能帮你快速解锁音乐文件,让收藏的歌曲摆脱平台限…

张小明 2025/12/31 12:46:09 网站建设

承德网站开发区地税17做网站

Python 性能优化与设计模式详解 1. 性能优化 1.1 多线程 多线程在性能优化中是一个重要手段。通常情况下,两个线程的运行速度大约是一个线程的两倍,但增加更多线程可能并不会带来速度提升,甚至可能因为开销问题导致性能下降,例如 24 个线程的运行速度可能比 12 个线程还…

张小明 2025/12/31 12:44:06 网站建设