Matplotlib היא ספריית תכנון רב עוצמה המשמשת בשפת התכנות Python. הוא מספק ממשק API מונחה עצמים להטמעת חלקות באפליקציות המשתמשות בערכות כלים למטרות כלליות של GUI כמו Tkinter, wxPython או Qt. אחד הכלים החשובים שמספק Matplotlib הוא היכולת ליצור עלילת רווחי סמך.
רווח סמך, כמונח סטטיסטי, מתייחס למידת הוודאות בשיטת דגימה. רמת ביטחון אומרת לך כמה בטוח אתה יכול להיות, מבוטאת באחוזים. לדוגמה, רמת ביטחון של 99% מצביעה על כך שכל אחד מהערכות ההסתברות שלך עשוי להיות מדויק ב-99% מהמקרים.
יצירת עלילת רווחי סמך באמצעות Matplotlib
יצירת עלילת רווחי סמך ב-Matplotlib כרוכה במספר שלבים. בואו נעמיק בהסבר של קוד Python המתאים כדי לבצע את השלבים הבאים:
ראשית, עלינו לייבא את הספריות הדרושות:
import matplotlib.pyplot as plt import numpy as np from scipy.stats import sem, t from scipy import mean
כעת, אנו יכולים לחשב את רווח הסמך בעקבות השלבים הבאים.
1. קבע מערך נתונים אקראי שעבורו נחשב את רווח הסמך.
2. חשב את השגיאה הממוצעת והתקן של מערך הנתונים.
3. קבע את מרווח הטעות עבור רווח הסמך.
4. לבסוף, חשב את טווח רווח הסמך.
להלן קוד Python המתאים לשלבים אלה.
confidence = 0.95 data = np.random.rand(100) n = len(data) m = mean(data) std_err = sem(data) h = std_err * t.ppf((1 + confidence) / 2, n - 1) start = m - h end = m + h
המשתנה 'ביטחון' הוא רמת הביטחון המבוטאת באחוזים, ו'נתונים' מכילים את מערך הנתונים האקראי. הממוצע והשגיאה הסטנדרטית מחושבים על ידי הפונקציה 'ממוצע' ו'sem' של ספריית SciPy בהתאמה. מרווח השגיאה 'h' נקבע על ידי הכפלת השגיאה הסטנדרטית בציון ה-t, אותו אנו שואבים מהתפלגות ה-t באמצעות הפונקציה 'ppf'. לבסוף, אנו מחשבים את טווח רווח הסמך.
שרטוט רווח הסמך ב-Matplotlib
בחלק האחרון של הקוד, אנו משתמשים ב-Matplotlib כדי לדמיין את רווח הסמך.
plt.figure(figsize=(9,6)) plt.bar(np.arange(len(data)), data) plt.fill_between(np.arange(len(data)), start, end, color='b', alpha=0.1) plt.title('Confidence Interval') plt.show()
הוא משתמש בתרשים סרגל כדי להציג את הנתונים ושיטת 'fill_between' כדי לייצג את רווח הסמך. הפונקציה 'דמות' מאתחלת דמות חדשה והפונקציה 'הצג' מציגה את העלילה.
יצירת עלילת רווחי סמך ב-Matplotlib היא דרך נוחה לנתח חזותית את הנתונים שלך, במיוחד נתונים הכרוכים בניתוח סטטיסטי. כלי רב עוצמה זה מציע דרך קלה ואינטואיטיבית להציג נתונים מורכבים בצורה שניתן לפרש בקלות, מה שהופך אותם לערכת כלים חיונית עבור כל מנתח או מדען של פיתון נתונים. על ידי הבנה כיצד לתמרן ולהשתמש בכך, נוכל להפוך את תהליך פרשנות הנתונים ליעיל ומדויק יותר.