python

当前位置:首页 > selenium教程 > 当前文章

selenium教程

selenium清除残留chromedriver进程(网上帖子是错的)

2020-09-14 98赞 python中国网
每篇文章努力于解决一个问题!python高级、python面试全套、操作系统经典课等可移步文章底部。

  selenium如果频繁通过chromedriver来启动和关闭谷歌浏览器,那么内存会残留一些chromedriver进程,因为chromedriver并不会随着程序的退出而立刻在内存消失。所以在频繁使用的时候可能感觉到卡顿,此时查下系统的进程会发现很多chromedriver驻留在内存!

  解决这个问题,也是有思路可寻的,网上也有相关文章,但是千篇一律,而且是错的!!!目测全部都是复制粘贴,真是流毒甚深。你看度娘显示相同的文章的:

  这个文章被N个人转载,流传甚广,可惜他说的在python中的操作是错的。他的错误做法如下:

c_service = Service('chromedriver路径')
c_service.command_line_args()
c_service.start()
driver = webdriver.Chrome()
driver.get("http://www.baidu.com")
driver.quit();
c_service.stop()

  经过验证,以上做法在启动之初就会产生2个chromedriver,一个是WebDriver类创建的,一个是Service类创建的,而且这两个chromedriver各自为政毫无关系,退出也是各自退出各自的。不相信的话,我们看WebDriver的源码,他的quit方法内部就是靠service.stop()。而且本人实际在cmd下查看过chromedriver进程确实有2个,所以上面那篇帖子的做法纯属意淫,画蛇添足,毫无根据!

 def quit(self):
        """
        Closes the browser and shuts down the ChromeDriver executable
        that is started when starting the ChromeDriver
        """
        try:
            RemoteWebDriver.quit(self)
        except Exception:
            # We don't care about the message because something probably has gone wrong
            pass
        finally:
            self.service.stop()

  正确的做法应该是这么来实现:

from selenium.webdriver.chrome.service import Service


service = Service('xxx') # 参数是chromedriver路径
service.command_line_args()
service.start()
option = Options()
No_Image_loading = {"profile.managed_default_content_settings.images": 2}
option.add_experimental_option("prefs", No_Image_loading)
driver = webdriver.Remote(service.service_url,options=option)
driver.get('http://mail.sina.net');
service.stop()

  以上做法可行是因为WebDriver类本身就是继承了RemoteWebDriver类,不过要注意上面的方法创建的driver实例不具备execute_cdp_cmd方法,因为execute_cdp_cmd方法是WebDriver类定义的,没有这个方法可能无法屏蔽一些反爬特征。

  如果想彻底的话,还是在结尾直接调用cmd命令来干掉chromedriver进程【 os.system('taskkill /im chromedriver.exe /F')】记得加个异常处理免得chromedriver不存在了你还在杀死他。

文章评论

selenium清除残留chromedriver进程(网上帖子是错的)文章写得不错,值得赞赏