تجزیه و تحلیل آماری پایه با NumPy


تجزیه و تحلیل آماری پایه با NumPyتجزیه و تحلیل آماری پایه با NumPy

تجزیه و تحلیل آماری پایه با NumPy

مقدمه

تجزیه و تحلیل آماری در علم داده مهم است. به ما در درک بهتر داده ها کمک می کند. NumPy یک کتابخانه ضروری پایتون برای عملیات عددی است. این فرآیند را ساده و سرعت می بخشد. در این مقاله، چندین تابع تحلیل آماری پایه ارائه شده توسط NumPy را بررسی خواهیم کرد.

NumPy یک کتابخانه پایتون برای محاسبات عددی است. این به شما امکان می دهد روی جداول و توابع ریاضی کار کنید. محاسبات را سریعتر و آسان تر می کند. NumPy برای تجزیه و تحلیل داده ها و کار علمی در پایتون ضروری است.

برای شروع، ابتدا باید NumPy را وارد کنید تا تجزیه و تحلیل آماری انجام شود.

طبق قرارداد، ما استفاده می کنیم np به عنوان نام مستعار برای NumPy. این امر فراخوانی توابع آن را آسان تر می کند.

حال بیایید به چندین تابع آماری کلیدی برای تجزیه و تحلیل آماری پایه در NumPy نگاه کنیم.

میانگین

میانگین معیار گرایش مرکزی است. مجموع تمام مقادیر تقسیم بر تعداد مقادیر است. ما استفاده می کنیم میانگین () تابع محاسبه میانگین

نحو: np.mean(data)

میانگین

میانگین اغلب به جای میانگین استفاده می شود. این مجموع همه مقادیر تقسیم بر تعداد مقادیر است. استفاده می کنیم متوسط ​​() تابع محاسبه میانگین. این تابع به این دلیل مفید است که به شما امکان می دهد وزن ها را برای محاسبه میانگین وزنی لحاظ کنید.

نحو: np.average(data)، np.average(data, weights=weights)

میانه

میانه مقدار متوسط ​​یک مجموعه داده مرتب شده است. زمانی که مجموعه داده دارای تعداد فرد باشد، میانه مقدار میانی است. زمانی که مجموعه داده دارای تعداد زوج باشد، میانه میانگین دو مقدار میانی است. ما استفاده می کنیم میانه () تابع محاسبه میانه

نحو: np.median(data)

واریانس

واریانس پراکندگی اعداد را از میانگین اندازه گیری می کند. این نشان می دهد که مقادیر در یک مجموعه داده چقدر با میانگین متفاوت است. واریانس بالاتر به معنای پراکندگی بیشتر است. ما استفاده می کنیم var() تابع برای محاسبه واریانس

نحو: np.var(data)

انحراف معیار

انحراف معیار نشان می دهد که اعداد چقدر از میانگین متفاوت هستند. این جذر واریانس است. انحراف استاندارد بالاتر به معنای پراکندگی بیشتر است. درک آن آسان تر است زیرا از واحدهای مشابه داده استفاده می کند. ما استفاده می کنیم std() تابع برای محاسبه انحراف استاندارد.

نحو: np.std(data)

حداقل و حداکثر

توابع حداقل و حداکثر به شما امکان می دهد به ترتیب کوچکترین و بزرگترین مقادیر را در مجموعه ای از داده ها شناسایی کنید. ما استفاده می کنیم دقیقه () و حداکثر () توابع برای محاسبه این مقادیر.

نحو: np.min(data)، np.max(data)

درصدها

صدک ها نشان می دهد که یک مقدار در یک مجموعه داده کجا قرار می گیرد. به عنوان مثال، صدک 25 مقداری است که 25 درصد داده ها زیر آن قرار می گیرند. درصدها به ما کمک می کنند تا توزیع داده ها را درک کنیم. ما استفاده می کنیم صدک () تابع برای محاسبه صدک

نحو: np.percentile(data, percentile_value)

ضریب همبستگی

ضریب همبستگی نشان می دهد که چگونه دو متغیر به صورت خطی مرتبط هستند. از -1 تا 1 متغیر است. مقدار 1 به معنای رابطه مثبت است. مقدار -1 به معنای رابطه منفی است. مقدار 0 به این معنی است که هیچ رابطه خطی وجود ندارد. ما استفاده می کنیم corrcoef() تابعی برای محاسبه ضریب همبستگی

نحو: correlation_matrix = np.corrcoef(data1, data2)، correlation_coefficient = correlation_matrix[0, 1]

محدوده (اوج به اوج)

محدوده (اوج به اوج) پراکندگی داده ها را اندازه گیری می کند. این تفاوت بین بالاترین و کمترین مقدار است. این به ما کمک می کند تا ببینیم داده ها چقدر پراکنده هستند. ما استفاده می کنیم ptp() تابع برای محاسبه محدوده

نحو: range = np.ptp(data)

نتیجه گیری

NumPy به شما امکان می دهد تا تجزیه و تحلیل های آماری اولیه را انجام دهید. برای آمارهای پیچیده تر، می توان از کتابخانه های دیگری مانند SciPy استفاده کرد. دانستن این اصول به بهبود تجزیه و تحلیل داده ها کمک می کند.

آمار کارشناسی ارشد برای یادگیری ماشین!

روش های آماری برای یادگیری ماشینروش های آماری برای یادگیری ماشین

یک درک عملی از آمار ایجاد کنید

با نوشتن خطوط کد در پایتون

نحوه کار را در کتاب الکترونیکی جدید من بیابید:
روش های آماری برای یادگیری ماشین

فراهم می کند آموزش های خودآموز در موضوعاتی مانند:
آزمون فرضیه، همبستگی، آمار ناپارامتریک، نمونه گیری مجددو خیلی بیشتر…

یاد بگیرید چگونه داده ها را به دانش تبدیل کنید

درس خواندن را رها کنید. فقط نتایج

ببین داخلش چیه



منبع:aitoolsclub.com/

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *