خانه / آموزش‌ها / آموزش ماژول dis در پایتون (تحلیل بایت‌کد)

آموزش ماژول dis در پایتون (تحلیل بایت‌کد)

🐍 HomeOfPython
|
📅 1404/10/18

سطح مقدماتی (Beginner Level)

ماژول dis (مخفف Disassembler) یکی از ابزارهای قدرتمند در کتابخانه استاندارد پایتون است که به شما اجازه می‌دهد کدهای پایتون را به دستورالعمل‌های سطح پایین‌تری به نام بایت‌کد (Bytecode) ترجمه کنید. پایتون قبل از اجرای کد شما، آن را به بایت‌کد تبدیل می‌کند و ماشین مجازی پایتون (CPython VM) این بایت‌کدها را اجرا می‌کند.

یادگیری dis به شما کمک می‌کند تا بفهمید "زیر کاپوت" پایتون چه می‌گذرد و چرا برخی کدها سریع‌تر از بقیه اجرا می‌شوند.

۱. مفهوم بایت‌کد و استفاده اولیه از dis.dis()

وقتی یک تابع یا اسکریپت می‌نویسید، مفسر پایتون آن را به مجموعه‌ای از دستورالعمل‌های ساده (مثل "بارگذاری مقدار"، "جمع کردن"، "ذخیره کردن") تبدیل می‌کند. تابع dis.dis() این دستورالعمل‌ها را به شکلی خوانا برای انسان چاپ می‌کند.

مثال اول: مشاهده بایت‌کد یک تابع ساده

در این مثال، ما یک تابع ساده جمع می‌نویسیم و بایت‌کد آن را مشاهده می‌کنیم.

Python

مثال دوم: تحلیل یک رشته کد

شما می‌توانید حتی بدون تعریف تابع، بایت‌کد یک رشته متنی حاوی کد پایتون را ببینید.

Python

۲. خواندن خروجی dis (ستون‌ها و ساختار)

خروجی ماژول dis دارای چند ستون اصلی است که هر کدام معنای خاصی دارند:

  1. شماره خط (Line Number): خطی از کد اصلی که دستورالعمل مربوط به آن است.
  2. آفست (Offset): آدرس دستورالعمل در حافظه بایت‌کد.
  3. نام دستور (Opcode Name): نام عملیات (مثل LOAD_CONST یا BINARY_ADD).
  4. آرگومان (Argument): مقداری که دستورالعمل روی آن کار می‌کند (ایندکس متغیر یا مقدار ثابت).
  5. توضیحات (Human-readable): مقدار واقعی متغیر یا ثابت (در پرانتز).

مثال اول: بررسی دستورالعمل‌های بارگذاری و عملیات ریاضی

در اینجا می‌بینیم که چگونه اعداد بارگذاری شده (LOAD_CONST) و سپس جمع می‌شوند (BINARY_ADD).

Python

مثال دوم: بررسی متغیرهای سراسری و محلی

تفاوت دستور LOAD_FAST (برای متغیرهای محلی) و LOAD_GLOBAL (برای متغیرهای سراسری) را در این مثال ببینید.

Python

مثال سوم: ساختار شرطی (If/Else)

مشاهده کنید که چگونه ساختارهای کنترلی مثل if به دستورالعمل‌های "پرش" (Jump) تبدیل می‌شوند.

python
# Static code: Logic explanation regarding Jump
# دستور POP_JUMP_IF_FALSE به مفسر می‌گوید اگر شرط برقرار نبود،
# به آدرس دیگری از بایت‌کد بپرد.
def strict_check(x):
    if x > 0:
        return True
    else:
        return False
Python

سطح پیشرفته (Professional Level)

در سطح حرفه‌ای، از dis برای تحلیل عملکرد (Performance Tuning)، درک دقیق "پشته" (Stack Machine) پایتون، و بررسی آبجکت‌های کد (Code Objects) استفاده می‌شود. ماشین مجازی پایتون مبتنی بر پشته است، به این معنی که دستورالعمل‌ها مقادیر را به بالای پشته اضافه (Push) یا از آن حذف (Pop) می‌کنند.

۱. تحلیل ماشین پشته (Stack Machine)

درک اینکه پایتون چگونه پشته را مدیریت می‌کند برای دیباگ کردن خطاهای پیچیده و نوشتن کدهای C-Extension بسیار حیاتی است. هر دستورالعمل دقیقاً مشخص می‌کند که چه تغییری در پشته ایجاد می‌کند.

مثال اول: توالی عملیات در پشته

برای عبارت a + b * c، پایتون ابتدا باید b و c را در پشته قرار دهد، آن‌ها را ضرب کند، نتیجه را نگه دارد، سپس a را بیاورد و با نتیجه قبلی جمع کند.

Python

مثال دوم: مدیریت توابع و آرگومان‌ها در پشته

وقتی تابعی صدا زده می‌شود (CALL_FUNCTION)، آرگومان‌ها باید از قبل به ترتیب خاصی در پشته چیده شده باشند.

Python

۲. بررسی شیء کد (Code Object) با dis.show_code

هر تابع در پایتون دارای یک ویژگی به نام __code__ است. تابع dis.show_code() اطلاعات متادیتای کامپایل شده را نمایش می‌دهد، مانند تعداد متغیرهای محلی، اندازه پشته مورد نیاز، و لیست ثابت‌ها (co_consts) و نام‌ها (co_names).

مثال اول: استخراج متادیتای تابع

این مثال نشان می‌دهد که یک تابع چه تعداد آرگومان می‌گیرد و چه ثابت‌هایی در آن ذخیره شده‌اند.

Python

مثال دوم: دسترسی مستقیم به بایت‌کد خام

گاهی اوقات نیاز دارید بایت‌کد خام (به صورت بایت) را ببینید، نه نسخه ترجمه شده را.

python
# Static code: Accessing co_code
def raw_access():
    pass

# بایت‌کد خام به صورت رشته‌ای از بایت‌ها ذخیره می‌شود
# print(raw_access.__code__.co_code)

۳. بهینه‌سازی و مقایسه عملکرد (Performance Optimization)

یکی از مهم‌ترین کاربردهای dis برای برنامه‎نویسان حرفه‌ای، مقایسه روش‌های مختلف نوشتن کد برای انتخاب سریع‌ترین روش است. با شمارش تعداد دستورالعمل‌ها یا نوع آن‌ها می‌توان کارایی را تخمین زد.

مثال اول: مقایسه الحاق رشته‌ها (Concatenation vs Formatting)

بررسی تفاوت سطح پایین بین استفاده از + و f-string. معمولاً f-string بهینه‌تر عمل می‌کند زیرا به جای فراخوانی‌های مکرر، از دستورالعمل‌های فرمت‌بندی مخصوص استفاده می‌کند.

Python
Python

مثال دوم: ساخت دیکشنری

مقایسه ساخت دیکشنری با dict() در برابر استفاده از آکولاد {}. معمولاً {} سریع‌تر است زیرا یک دستورالعمل مستقیم (BUILD_MAP) دارد، در حالی که dict() نیاز به بارگذاری نام تابع و فراخوانی آن دارد.

Python

۴. استفاده از خط فرمان (Command Line Interface)

شما می‌توانید بدون تغییر کد اسکریپت خود، ماژول dis را مستقیماً از ترمینال روی فایل‌های .py اجرا کنید.

مثال اول: دستور پایه

python
# Static code: Shell command example
# python -m dis myscript.py

مثال دوم: نمایش بایت‌کد کامپایل شده

python
# Static code: Disassembling directly from CLI allows verifying compilation without running
# python -m dis src/content/articles/script.py