کار با Selenium در پایتون

automation چیست؟

یکی از کارهایی که می توانید با پایتون انجام دهید، testing یا automation است. اگر یک شرکت داشته باشیم که برنامه ای را برای مردم ساخته است، باید مطمئن شویم که این برنامه بدون مشکل اجرا می شود. ما در فصلی از این دوره آموزشی به سراغ نوشتن unit test می رویم اما بحث testing ای که در اینجا از آن صحبت می کنیم، متفاوت است. ما انسان هستیم بنابراین با وب سایت ها کارهای انسانی می کنیم؛ به طور مثال از صفحات تاچ اسکرین استفاده می کنیم یا یک صفحه را اسکرول می کنیم. شرکت های بزرگ معمولا افرادی را استخدام می کنند که در این دست از تست ها و اتوماسیون (automation) به آن ها کمک کنند. هدف automation شبیه سازی رفتار انسان است و مختص پلتفرم خاصی مانند اندروید یا وب یا ویندوز و غیره نیست بلکه در تمام پلتفرم های موجود مطرح است. automation یکی از راه های testing نرم افزار است چرا که با آن می توانید هزاران کاربر را در سیستم خود شبیه سازی کنید اما در غیر از آن باید چندین نفر را برای نوشتن تست در کدها استخدام کنید.

آشنایی با Selemium و نصب آن

یکی از شاخه های اتوماسیون، browser automation نام دارد. در browser automation هدف ما شبیه سازی رفتار یک کاربر با مرورگر خود است. به زبان ساده تر با استفاده از کدها به مرورگر می گوییم که چه کاری انجام داده و چه رفتار از خود نشان بدهد. یکی از بهترین برنامه های موجود در پایتون برای انجام این کار Selenium است. طبیعتا برای استفاده از Selenium باید آن را نصب کنیم اما مثل همیشه دو راه برای نصب آن داریم. راه اول نصب سراسری آن با اجرای pip install است اما راه دوم که از نظر من بهتر است، استفاده از یک virtual environment است. ابتدا یک پوشه جدید به نام Selenium را ایجاد کنید و ترمینال خود را درون این مسیر باز نمایید. اگر می خواهید از روش نصب سراسری پیش بروید هیچ مشکلی نیست و فقط باید دستور زیر را اجرا کنید تا Selenium برایتان نصب شود:

pip install selenium

اما اگر می خواهید مثل من از virtual environment ها استفاده نمایید باید ابتدا با دستور زیر یک virtual environment را بسازید:

python3 -m venv my-venv

عبارت my-venv همان نام virtual environment ما است بنابراین شما می توانید هر نام دیگری را برایش انتخاب کنید. اجرای این دستور چند لحظه طول می کشد و سپس virtual environment برایتان ساخته می شود (یک پوشه جدید به نام my-venv را مشاهده خواهید کرد). حالا باید این virtual environment را فعال کنیم یا وارد آن بشویم. برای انجام این کار دستور زیر را اجرا می کنیم:

. my-venv/bin/activate

با انجام این کار عبارت my-env در کنار قسمت prompt ترمینال شما ظاهر می شود و متوجه می شوید که وارد virtual environment شده اید. حالا که درون virtual environment هستیم می توانیم دستور زیر را اجرا کنیم:

pip install selenium

با این کار selenium برایمان نصب شده است.

تشخیص پکیج selenium در vscode

در این قسمت باید ویرایشگر کد خود را در پوشه Selenium باز کرده و یک فایل جدید به نام automation.py را در آن ایجاد کنید. اولین کاری که در این فایل انجام می دهیم وارد کردن پکیج selenium است:

from selenium import webdriver

در صورتی که از Visual Studio Code استفاده می کنید احتمالا مشکلی خواهید داشت. virtual environment به صورت خودکار برایتان تشخیص داده نشده است و هنوز از حالت سراسری پایتون استفاده می کنید. از آنجایی که ما Selenium را فقط در virtual environment خود نصب کرده ایم طبیعتا در حالت سراسری در دسترس نبوده و visual studio code نصب بودن پکیجی به نام selenium را تشخیص نمی دهد. برای حل این مشکل به قسمت پایین و سمت چپ visual studio code نگاهی بیندازید. این قسمت interpreter path یا مسیر مفسر پایتون را به شما نشان می دهد که به صورت پیش فرض روی پایتون 3.8 یا 3.9 است (بسته به نسخه ای که نصب کرده اید). اگر روی آن کلیک کنید مسیرهای مختلفی برای مفسر پایتون را مشاهده خواهید کرد که یکی از آن ها my-env (همان virtual environment ما) است. با انتخاب این گزینه یک پوشه جدید به نام vscode. در پوشه Selenium ایجاد می شود که درون آن فایلی به نام settings.json وجود دارد. محتوای این فایل به شکل زیر است:

{

    "python.pythonPath": "my-venv/bin/python"

}

همانطور که مشخص است حالا visual studio code می داند که باید از چه مسیری به عنوان مفسر پایتون استفاده کند. از این به بعد مشکلی در تشخیص پکیج selenium نخواهید داشت.

نصب driver های selenium

همانطور که می دانید هر مرورگری ظاهر و interface خاص خودش را دارد، قابلیت های خاص خودش را دارد، توانایی ها و محدودیت های خاص خودش را دارد، و الی آخر. Selenium برای اینکه بتواند با این خصوصیت ها و توانایی های مرورگر ها کار کند نیاز به یک driver خاص برای هر کدام از آن ها دارد. هر مرورگر متفاوت است بنابراین selenium برای هر کدام از مرورگر های موجود مانند کروم یا فایرفاکس، یک درایور جداگانه دارد که باید آن را نصب کنیم. من لیستی از درایورهای موجود را برایتان قرار می دهم:

من در این آموزش از گوگل کروم استفاده می کنیم بنابراین به صفحه درایور کروم می روم اما شما می توانید از هر درایور دیگری نیز استفاده کنید. توجه داشته باشید که اگر به لینک درایور کروم رفتید، آخرین نسخه موجود را دانلود نکنید! چرا؟ آخرین نسخه موجود beta بوده و stable نیست؛ برنامه های beta برنامه هایی هستند که هنوز تست نشده و ممکن است دارای خطا هایی جزئی باشند (نسخه آزمایشی) اما برنامه های stable (به معنی «پایدار») تست شده هستند و نسخه نهایی می باشند. برای مطمئن شدن از این موضوع می توانید به صفحه اصلی (https://sites.google.com/a/chromium.org/chromedriver/home) بروید و به قسمت All versions available in Downloads نگاهی بیندازید. در زمان نگارش این مقاله ما گزینه های زیر را می بینیم:

All versions available in Downloads

Latest stable release: ChromeDriver 88.0.4324.96

Latest beta release: ChromeDriver 89.0.4389.23

همانطور که می بینید نسخه ۸۹ این درایور هنوز در حالت beta است. طبیعتا این نسخه ها بر اساس نسخه های گوگل کروم است بنابراین اگر از درایور 88 استفاده می کنید باید مثل من نسخه 88 گوگل کروم را نصب داشته باشید. اگر دوست ندارید گوگل کروم را نصب کنید مشکلی نیست، می توانید از درایور beta استفاده کنید گرچه ممکن است به خطاهایی برخورد کنید. من شخصا گوگل کروم 88 را دارم بنابراین درایور stable (پایدار) را نصب می کنم تا مشکلی نداشته باشیم. با کلیک روی درایور پایدار به صفحه ای مانند https://chromedriver.storage.googleapis.com/index.html?path=88.0.4324.96/ منتقل می شوید، البته بسته به اینکه در چه زمانی این مقاله را مطالعه می کنید، نسخه درایور برای شما متفاوت خواهد بود. محتویات این صفحه متنی و به شکل زیر هستند:

[DIR]       Parent Directory                 -

[DIR]       chromedriver_linux64.zip 2021-01-20 19:13:52         5.42MB 

40537b052b77c418f05abc1428ecc3c3

[DIR]       chromedriver_mac64.zip   2021-01-20 19:13:53         7.76MB 

b91266f2468907e6c3e58220182cf19f

[DIR]       chromedriver_mac64_m1.zip           2021-01-20 19:13:55         6.99MB 

dd6f6ae34fa210b1993fb159d24ce330

[DIR]       chromedriver_win32.zip    2021-01-20 19:13:57         5.36MB 

9f5e7741994b46b1acca15d779cfe7ad

[DIR]       notes.txt                2021-01-20 19:01:19         0.00MB 

cbd16414ef0a8fc16a461d9d9dfa6b51

اگر به این نوشته ها دقت کنید متوجه می شوید که هر لینک برای یک سیستم عامل خاص طراحی شده است. بسته به اینکه از چه سیستم عاملی استفاده می کنید، گزینه مناسب برای خودتان را انتخاب کنید. فایل دانلود شده را از حالت فشرده خارج کنید و سپس فایل اصلی درایور را در پوشه Selenium و در کنار automation.py قرار بدهید.

در مرحله بعدی وارد فایل automation.py شده و یک نمونه یا instance از مرورگر را ایجاد می کنیم:

from selenium import webdriver




chrome_browser = webdriver.Chrome('./chromedriver')

همانطور که مشخص است این کار با پاس دادن آدرس فایل درایور (chromedriver) انجام می شود. با استفاده از این روش هیچ نیازی به پیکربندی اضافه نخواهیم داشت و کاربران ویندوز نیز می توانند از همین روش استفاده کنند. اگر از کاربران ویندوز هستید فرض کنید که فایل درایور (فایلی که پسوند exe دارد) را در مسیر /Users/yourname/Desktop/foundations/chromedriver قرار داده اید. در این حالت می توانید با روش بالا و به شکل زیر آن را آدرس دهی کنید:

driver_path = '/Users/yourname/Desktop/foundations/chromedriver'

chrome_browser = webdriver.Chrome(executable_path=driver_path)

روش دیگر برای کاربران ویندوز این است که فایل درایور را در PATH سیستم خود قرار بدهند. چطور؟ باید ابتدا به مسیر زیر در کنترلر پنل سیستم خود بروید:

Control Panel -> System and Security Settings -> System

در آنجا گزینه ای به نام Advanced system settings را خواهید دید که باید روی آن کلیک کنید. با این کار پنجره ای برایتان باز می شود که در آن دکمه ای به نام Environment Variables وجود دارد. با کلیک روی آن پنجره دیگری باز می شود که دو قسمت است و در قسمتی از آن نوشته شده است: System Variables. در آنجا به دنبال گزینه ای به نام path بگردید. روی آن کلیک کنید تا وارد حالت ویرایش شویم. در آنجا آدرس فایل chromedriver.exe را به این رشته اضافه می کنیم. یادتان نرود که قبل از اضافه کردن رشته جدید، در انتهای رشته قبلی علامت نقطه ویرگول انگلیسی (;) را قرار دهید. مثلا انتهای رشته من بدین شکل در آمده است (خود فایل chromedriver.exe را در مسیر ذکر نکنید):

C:\Program Files\nodejs\;C:\Windows\ChromeDriverFolder

این فرآیند در ویندوز ۱۰ راحت تر است و فقط کافی است رشته C:\Windows\ChromeDriverFolder را به عنوان یک ردیف جدید اضافه کنید. اگر این کار را انجام بدهید دیگر نیازی به پاس دادن آدرس فایل به webdriver.chrome ندارید و می توانید آن را به شکل زیر اجرا کنید:

from selenium import webdriver




chrome_browser = webdriver.Chrome()

کاربران لینوکس و مک نیز می توانند این کار را انجام بدهند. برای انجام این کار، ساده ترین حالت این است که فایل درایور را در /usr/bin یا /usr/local/bin قرار بدهید تا فایل درایور به PATH شما اضافه شود (البته می توانید از bashrc. نیز این کار را انجام بدهید) اما من پیشنهاد می دهم که همه کاربران (ویندوز، لینوکس و مک) از همان روش ساده تر استفاده کنید. یعنی فایل chromedriver.exe را در کنار automation.py قرار بدهید و مثل ما کد زیر را بنویسید:

from selenium import webdriver




chrome_browser = webdriver.Chrome('./chromedriver')

در صورتی که از کاربران ویندوز بوده و به خطا برخورد کردید، پسوند exe. را نیز به انتهای مسیر پاس داده شده به webdriver.chrome اضافه کنید. حالا اگر کد بالا را اجرا نمایید، گوگل کروم به صورت خودکار برایتان باز می شود و پیامی را دریافت می کنید که می گوید chrome is being controlled by automated test softwarre که یعنی کروم توسط نرم افزارهای اتوماسیون تست کنترل می شود. حالا بیایید کمی با دستور های دیگر Selenium آشنا شویم.

تست کردن Selenium

برای تست اولیه بیایید کروم را تمام صفحه کنیم. برای اینکار می گوییم:

from selenium import webdriver




chrome_browser = webdriver.Chrome('./chromedriver')




chrome_browser.maximize_window()

با اجرای این کد کروم برایتان باز شده و سپس صفحه maximize می شود (تمام صفحه می شود) بنابراین مطمئن می شویم که selenium را به صورت صحیح پیکربندی کرده ایم.

از اینجا به بعد باید یک هدف داشته باشیم که دستورات خود را روی آن اجرا کنیم. من وب سایت seleniumeasy.com/test را به شما پیشنهاد می دهم. این وب سایت (آدرس test/ آن) برای تست کردن کدهای selenium ایجاد شده است تا بتوانیم کدهای خودمان را روی انواع صفحات HTML تست کنیم. اگر به منوی سمت چپ صفحه در این وب سایت نگاه کنید انواع و اقسام عناصر HTML را مشاهده می کنید. من برای تست اول خودمان از مسیر seleniumeasy.com/test/basic-first-form-demo.html استفاده می کنم. این مسیر درون خودش دو فیلد ساده از فرم های HTML را دارد بنابراین برای شروع کار مناسب است.

اولین قدم برای انجام این کار رفتن به صفحه مورد نظر است. این کار با دستور get انجام می شود:

from selenium import webdriver




chrome_browser = webdriver.Chrome('./chromedriver')




chrome_browser.maximize_window()




chrome_browser.get(

    'https://www.seleniumeasy.com/test/basic-first-form-demo.html')

اگر کد بالا را اجرا نمایید، گوگل کروم در مسیر مشخص شده باز خواهد شد بنابراین این قدم اول است. حالا چطور می توانیم درون فرم ها مقدار خاصی را بنویسیم؟ Selenium برای تعامل با صفحات HTML از ساختار HTML آن صفحه استفاده می کند بنابراین برای هدف گرفتن عنصر خاصی در صفحه ابتدا باید روشی برای هدف قرار دادن کد HTML آن را داشته باشیم. چطور این کار را انجام بدهیم؟ به راحتی روی یک عنصر در سایت مورد نظر کلیک راست کرده و گزینه inspect را انتخاب کنید. با انجام این کار صفحه developer tools باز می شود و می توانید آن عنصر را مشاهده کنید. به طور مثال <title> این صفحه به شکل زیر است:

<title>Selenium Easy Demo - Simple Form to Automate using Selenium</title>

حالا می خواهیم بدانیم آیا نوشته بالا در تگ <title> این صفحه موجود است یا خیر. برای انجام این کار به شکل زیر عمل می کنیم:

from selenium import webdriver




chrome_browser = webdriver.Chrome('./chromedriver')




chrome_browser.maximize_window()




chrome_browser.get(

    'https://www.seleniumeasy.com/test/basic-first-form-demo.html')




print('Selenium Easy Demo - Simple Form to Automate using Selenium' in chrome_browser.title)

با اجرای کد بالا عبارت True برایمان چاپ می شود بنابراین می فهمیم که این نوشته در تگ title وجود داشته است. توجه داشته باشید که این مقدار ممکن است در آینده تغییر کند (صاحبان سایت <title> را تغییر دهند) بنابراین به جای کپی کردن کد بالا، متن title را خودتان استخراج کنید. البته استفاده از print کمی آزار دهنده است بنابراین من از دستور assert در زبان پایتون استفاده می کنم:

from selenium import webdriver




chrome_browser = webdriver.Chrome('./chromedriver')




chrome_browser.maximize_window()




chrome_browser.get(

    'https://www.seleniumeasy.com/test/basic-first-form-demo.html')




assert 'D Demo - Simple Form to Automate using Selenium' in chrome_browser.title

من از عمد رشته title را بهم ریخته ام (D Demo در ابتدای رشته اصلی نیست) تا خطا بگیرم. کلیدواژه assert یک expression را بررسی می کند و در صورتی که آن expression صحیح (True) نباشد، یک خطای assertionError را پرتاب می کند. با اجرای کد بالا خطایی شبیه به خطای زیر را می گیریم:

y-venv/bin/python" "/media/amir/Development/Roxo Academy/Python/Selenium/automation.py"

Traceback (most recent call last):

  File "/media/amir/Development/Roxo Academy/Python/Selenium/automation.py", line 10, in <module>

    assert 'D Demo - Simple Form to Automate using Selenium' in chrome_browser.title

AssertionError

همانطور که می بینید خطای AssertionError را دریافت کرده ایم.

هدف قرار دادن عناصر با selector ها

در Selenium روش های مختلفی برای هدف قرار دادن عناصر مختلف، روش های مختلفی وجود دارد. منظور ما از selector ها همان selector های CSS است (در selenium برای هر کدام از این selector ها یک متد جداگانه داریم). به طور مثال در صفحه فرم خودمان عنصری به شکل زیر را داریم:

<div class="panel-heading">Single Input Field</div>

همانطور که می بینید این عنصر کلاسی به نام panel-heading دارد بنابراین می توانیم با متد find_element_by_class_name به این عنصر دسترسی داشته باشیم:

from selenium import webdriver




chrome_browser = webdriver.Chrome('./chromedriver')




chrome_browser.maximize_window()




chrome_browser.get(

    'https://www.seleniumeasy.com/test/basic-first-form-demo.html')




panel_heading = chrome_browser.find_element_by_class_name('panel-heading')




print(panel_heading)

با اجرای کد بالا نتیجه زیر را در کنسول مرورگر خود دریافت خواهید کرد:

<selenium.webdriver.remote.webelement.WebElement (session="6efc151162adbf7e88ec9fa9515a7a50", element="a5b3e6ab-6cbd-42bd-966e-e8117ab47ac5")>

این یک شیء webElement است و ما می توانیم هر کاری را با آن انجام بدهیم. من چند مثال از انواع عناصر HTML و روش دسترسی به آن ها را برایتان ذکر می کنم.

دسترسی با ID

فرض کنید عنصری با id زیر وجود داشته باشد:

<input id=”q” type=”text” />

برای هدف قرار گرفتن این عنصر باید به شکل زیر عمل کنیم:

element = chrome_browser.find_element_by_id(“q”)