← ניסוי

תורת סיב האנרגיה (Energy Filament Theory, EFT): מסגרת הכבידה הממוצעת בהשוואה לקו בסיס NFW מינימלי לחומר אפל קר (DM)

מחבר: Guanglin Tu
דוא״ל: riniky@energyfilament.org | ORCID: 0009-0003-7659-6138
שיוך: קבוצת העבודה של EFT, Shenzhen Energy Filament Science Research Co., Ltd. (סין)
גרסה: v1.1 | תאריך: 2026-02-14

קדם־פרסום (ללא ביקורת עמיתים) | גרסה זו מיועדת להפצה ציבורית ולבדיקה חוזרת, ואינה מייצגת את הגרסה הסופית של כתב עת.

רישיון: הדוח (CC BY-NC-ND 4.0); חבילת השחזור המלאה (CC BY 4.0).

דוח ברמת פרסום (Concept DOI): https://doi.org/10.5281/zenodo.18526334
חבילת שחזור מלאה (Concept DOI): https://doi.org/10.5281/zenodo.18526286

0 תקציר מנהלים (Executive Summary)

דוח זה הוא מהדורת ארכיון מלאה ברמת פרסום, שהופקדה ב-Zenodo. הוא מציע שרשרת בדיקה אחת, ניתנת לביקורת, מן הנתונים ומפנקס המודלים, דרך השוואה הוגנת ובדיקת סגירה, ועד חומרי השחזור. נספח B (P1A) משמש כתוספת לבדיקת חסינות: הוא מרכז מבחן לחץ לקו בסיס DM סטנדרטי יותר יחד עם שגיאת מערכת מרכזית בצד העידוש, כדי לבדוק את רגישות המסקנות העיקריות למידול DM מציאותי יותר ולטיפול בשגיאות מערכת של עידוש.

מסקנות ליבה (ארבע אמירות שניתן לצטט ישירות; ראו סעיף 2.4):

(1) בהתאמת עקומות סיבוב (RC), משפחת EFT עולה באופן מובהק על DM_RAZOR בכל שילובי פונקציית הקרנל וה-prior; השיפור הטיפוסי הוא Δlog𝓛_RC ≈ 10^3 (ראו טבלה S1a).
(2) בבדיקת הסגירה RCGGL, EFT מציגה יכולת העברה חזקה יותר בין גלאים/בדיקות: עוצמת הסגירה Δlog𝓛_closure (TruePerm) גבוהה משמעותית מזו של DM_RAZOR, והפער נשאר חסין בסריקות covariance shrinkage, R_min ו-σ_int (ראו איור S3 וטבלה S1b).
(3) בהתאמה משותפת (RC+GGL), EFT שומרת על יתרון יציב; ובביקורת שלילית, שבה מפורקת המפה המשותפת, היתרון קורס. הדבר תומך בכך ש״אפקט הכבידה הממוצעת״ נובע מן המיפוי המשותף ולא מהתאמה מקרית (ראו איור S4).
(4) נספח B (P1A) בוחן את צד ה-DM באמצעות מודולי קו בסיס סטנדרטיים יותר ופרמטר מטרד מרכזי אחד של שגיאת מערכת בעידוש, בלי להגדיל משמעותית את הממדיות; שדרוגים אלה אינם מבטלים את יתרון הסגירה של EFT (ראו טבלה B1 ואיור B1).

זמינות נתונים וקוד: Concept DOI של הדוח הוא 10.5281/zenodo.18526334; Concept DOI של חבילת השחזור המלאה הוא 10.5281/zenodo.18526286. התגים המתאימים לנספח B (P1A) הם run_tag=20260213_151233, closure_tag=20260213_161731 ו-joint_tag=20260213_195428.

1 תקציר

אנו עורכים השוואה כמותית ניתנת לשחזור בין שתי מסגרות תאורטיות, על אותם נתונים ותחת אותו פרוטוקול סטטיסטי: מודל ״תיקון הכבידה הממוצעת״ שמוצע במסגרת EFT, וכן מודל קו בסיס של הילות NFW בחומר אפל קר (DM_RAZOR). DM_RAZOR נבחר במכוון כ״קו בסיס DM מינימלי״: הילת NFW עם יחס cM קבוע (ללא halo-to-halo scatter), כדי לספק נקודת ייחוס שקופה, ניתנת לביקורת ולשחזור. חשוב להדגיש גם שבמאמר זה EFT מטופלת כפרמטריזציה פנומנולוגית, דמוית MOND, של שדה אפקטיבי או תגובה אפקטיבית, הנבחנת תחת פרוטוקול סטטיסטי אחיד; אין כאן גזירה מיקרוסקופית של עקרונות ראשונים.

הנתונים כוללים 2295 נקודות מהירות מעקומות הסיבוב SPARC לאחר עיבוד מוקדם אחיד וחלוקה לתאים (104 גלקסיות, 20 תאי RC-bin), וכן את צפיפות השטח האקוויוולנטית ΔΣ(R) בעידוש חלש בין גלקסיות מתוך KiDS-1000 (4 תאי מסה כוכבית × 15 נקודות R בכל תא, סך הכול 60 נקודות), תוך שימוש בקווריאנציה מלאה.

ביצענו, לפי הסדר, היסק RC-only, בדיקת סגירה RCGGL, היסק GGL-only והיסק משותף RC+GGL, וביקורת עקביות מבטיחה שכל המספרים המצוטטים ניתנים למעקב. תחת פנקס פרמטרים קשיח ואילוץ מיפוי משותף (DM: 20 פרמטרים log M200_bin; EFT: 20 פרמטרים log V0_bin ועוד log ℓ גלובלי אחד), משפחת EFT עדיפה בבירור על DM_RAZOR בהתאמה המשותפת: ΔlogL_total = 1155–1337 יחסית ל-DM_RAZOR. חשוב מכך, בדיקת הסגירה מראה של-posterior של RC יש כוח חיזוי לא־טריוויאלי עבור GGL: עוצמת הסגירה של EFT היא ΔlogL_closure = 172–281, מעל 127 של DM_RAZOR. כאשר ממפים מחדש באקראי את קבוצות RC-binGGL-bin, אות הסגירה קורס ל-6–23, וכך מתברר שהוא אינו מקריות סטטיסטית ואינו הטיית מימוש. בסריקות שיטתיות של σ_int, R_min ו-covariance shrinkage, היתרון היחסי של EFT נשאר חיובי ויציב בסדר הגודל. כדי לענות על טענה נפוצה שלפיה ״קו הבסיס של DM חלש מדי״ או ש״שגיאות מערכת נקראות כפיזיקה״, נספח B (P1A) מספק מבחן לחץ לקו בסיס DM סטנדרטי יותר אך עדיין נמוך־ממד וניתן לביקורת (כולל hierarchical cM scatter + prior, proxy חד־פרמטרי ל-core, lensing m והמודל המשולב DM_STD). תחת אותו פרוטוקול סגירה, שדרוגים אלה אינם מבטלים את יתרון הסגירה של EFT (ראו טבלה B1/איור B1).

מילות מפתח: עקומות סיבוב; עידוש חלש בין גלקסיות; בדיקת סגירה; EFT; חומר אפל קר; היסק בייסיאני

2 מבוא וסקירת תוצאות

עקומות סיבוב (RC) ועידוש חלש בין גלקסיות (GGL) הן שתי בדיקות כבידה משלימות: RC מגבילות את הפוטנציאל הדינמי במישור הדיסקה ואת יחס התאוצה הרדיאלית (RAR), ואילו GGL מודד את התפלגות המסה המוטלת ואת תגובת הכבידה בסקלת ההילה. עבור כל תאוריה מועמדת, השאלה המרכזית אינה אם אפשר להתאים כל מערך נתונים בנפרד, אלא אם אפשר להסביר את שניהם בעקביות תחת אותו מיפוי בין־נתוני ואותם אילוצים משותפים.

לכן מאמר זה מציב את ״בדיקת הסגירה (closure test)״ כפרוטוקול הסטטיסטי המרכזי: תחילה משתמשים ב-posterior של RC-only כדי לחזות קדימה את GGL, ואז משווים אותו לביקורת שלילית שבה מוחלף מיפוי RC-binGGL-bin באמצעות permutation / shuffle. כך נמדדת יכולת ההעברה החזויה בין מערכי נתונים (predictive transferability), ובו בזמן מסולקים אותות מדומים הנובעים מהטיית מימוש או מהתאמה מקרית.

מיקום תאורטי והיקף: מאמר זה אינו מנסה להציג כאן גזירה מיקרוסקופית של עקרונות ראשונים עבור EFT או נוסח רלטיביסטי מלא שלה. להפך, אנו מתייחסים ל-EFT כאל פרמטריזציה נמוכת־ממד, דמוית MOND, של שדה אפקטיבי/תגובה אפקטיבית (המתוארת באמצעות פונקציית קרנל f(x) וסולם גלובלי ℓ), ובוחנים באמצעות בדיקת הסגירה RCGGL את עקביותה בין הנתונים ואת יכולת ההעברה החזויה שלה, תחת פנקס פרמטרים קשיח.

תכנית המחקר והצהרת היקף: מאמר זה הוא חלק מתכנית תצפיתית מתמשכת מסדרת P. בנתונים הקיימים בסקלת גלקסיות אנו מחפשים שתי תרומות רקע אפקטיביות אפשריות: (i) ״רצפת כבידה״ (mean gravity floor), שניתנת לתיאור באמצעות תגובת כבידה ממוצעת לאחר coarse-graining, ו-(ii) ״רצפת רעש״ (stochastic/noise floor), הקשורה לתנודות בתהליכים מיקרוסקופיים. במאמר זה (P1) אנו מתמקדים רק בראשונה: בלי להניח מנגנון מיקרוסקופי כלשהו של יצירה, אנו מחפשים באמצעות בדיקת הסגירה RCGGL סימנים תצפיתיים לרצפת כבידה ממוצעת, ומשווים אותם לקו בסיס DM ניתן לביקורת תחת פרוטוקול אחיד. כתמונה פיזיקלית מנחה, אם קיימות דרגות חופש קצרות־חיים, דעיכתן או השמדתן יכולה להמיר מסת מנוחה לאנרגיה ותנע הנישאים בידי דרגות חופש אחרות; ברמה האפקטיבית הדבר מתאים באופן טבעי לפירוק ״תרומת ממוצע + תרומת תנודות״. עם זאת, המאמר אינו ממדל כמותית תמונה מיקרוסקופית זו.

כדי להימנע מקריאת יתר, גבולות ההיקף של המאמר הם אלה:
• מה המאמר עושה: מודד באמצעות בדיקת סגירה את יכולת ההעברה החזויה בין נתונים תחת פנקס פרמטרים קשיח ואילוצי מיפוי משותף, ומבצע השוואה ניתנת לשחזור בין תגובת הכבידה הממוצעת של EFT לבין קו בסיס DM.
• מה המאמר אינו עושה: אינו דן בשום מנגנון יצירה מיקרוסקופי, בשפע/משך חיים או באילוצים קוסמולוגיים; אינו ממדל את הרכיב האקראי המתאים ל״רצפת הרעש״.
• מה המאמר אינו טוען: מטרתו אינה להפיל את החומר האפל. P1 אינו נותן פסק דין סופי בשאלה אם ״הרצפה״ קיימת, אלא מדווח על ראיה שלבּית: בתחום המדידה החסין שנבחר כאן, הנתונים מעדיפים מודל הכולל תגובת כבידה ממוצעת.

במקביל אנו מבהירים כי DM_RAZOR מייצג רק קו בסיס NFW מינימלי וניתן לביקורת (cM קבוע וללא scatter; ללא Adiabatic Contraction, ללא feedback core, ללא אי־ספריות וללא איברי סביבה). לכן המסקנה העיקרית בגוף המאמר מוגבלת בקפדנות לכך: תחת קו הבסיס המינימלי הזה ותחת פנקס הפרמטרים/אילוצי המיפוי הקשיחים, עקביותה הבין־נתונית של EFT חזקה יותר. כדי לענות על שאלה נפוצה — האם קו בסיס ΛCDM סטנדרטי יותר ומידול של שגיאות מערכת מרכזיות בעידוש ישנו באופן משמעותי את המסקנה — ריכזנו בנספח B (P1A: מבחן לחץ לסטנדרטיזציה של קו בסיס DM) שדרוגי DM סטנדרטיים יותר אך עדיין נמוכי־ממד וניתנים לביקורת, יחד עם nuisance בצד העידוש, ושמרנו על אותו מיפוי משותף ואותו פרוטוקול סגירה בדיוק (ראו טבלה B1/איור B1).

2.1 Tab S1aS1b: סיכום מדדי מפתח (Strict)

טבלה S1a מציגה את מדדי ההשוואה העיקריים של ההתאמה המשותפת (RC+GGL): logL, ΔlogL, AICc ו-BIC. טבלה S1b מציגה את מדדי בדיקת הסגירה וסריקות החסינות (closure, ביקורת שלילית shuffle, וטווחי σ_int / R_min / cov-shrink). כל המספרים מגיעים מטבלת הסיכום הקפדנית Tab_Z1_master_summary וניתנים למעקב פרטני בארכיון הפרסום.

טבלה S1a | מדדי ההשוואה העיקריים של ההתאמה המשותפת (RC+GGL, Strict).

מודל (workspace)

קרנל W

k

logL_total משותף (best)

ΔlogL_total vs DM

AICc

BIC

DM_RAZOR

none

20

-16927.763

0.0

33895.885

34010.811

EFT_BIN

none

21

-15590.552

1337.21

31223.501

31344.155

EFT_WEXP

exponential

21

-15668.83

1258.932

31380.057

31500.711

EFT_WYUK

yukawa

21

-15772.936

1154.827

31588.268

31708.922

EFT_WPOW

powerlaw_tail

21

-15633.321

1294.442

31309.038

31429.692

טבלה S1b | מדדי סגירה וחסינות (Strict).

מודל (workspace)

ΔlogL של סגירה (true-perm)

ΔlogL לאחר shuffle בביקורת שלילית

טווח ΔlogL בסריקת σ_int

טווח ΔlogL בסריקת R_min

טווח ΔlogL בסריקת cov-shrink

DM_RAZOR

126.678

22.725

EFT_BIN

231.611

14.984

459–1548

1243–1289

1337–1351

EFT_WEXP

171.977

6.04

408–1471

1169–1207

1259–1277

EFT_WYUK

179.808

14.688

380–1341

1065–1099

1155–1166

EFT_WPOW

280.513

6.672

457–1500

1203–1247

1294–1308


2.2 Fig S3: עוצמת סגירה (RC-only → חיזוי GGL)

עוצמת הסגירה מוגדרת כ-ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩: על דגימות posterior של RC-only חוזים קדימה את GGL ומשווים לביקורת שלילית שבה מוחלף מיפוי RC-binGGL-bin.

איור S3 | עוצמת סגירה (גדול יותר עדיף): יתרון הלוג־סבירות הממוצע של חיזוי GGL מתוך RC-only.


2.3 Fig S4: השוואת ההתאמה המשותפת העיקרית (RC+GGL)

יתרון ההתאמה המשותפת מוגדר כ-ΔlogL_totallogL_total(model)logL_total(DM_RAZOR). באותם נתונים, באותו מיפוי ובסדר גודל פרמטרים דומה, משפחת EFT משיגה log-likelihood משותף גבוה משמעותית.

איור S4 | יתרון התאמה משותפת (גדול יותר עדיף): best logL_total של RC+GGL יחסית ל-DM_RAZOR.


2.4 ארבע מסקנות (ניתנות לציטוט ישיר)

(1) בניתוח משותף אחיד של עקומות הסיבוב SPARC ושל העידוש החלש KiDS-1000, מודלי מסגרת הכבידה הממוצעת של EFT עדיפים שיטתית על DM_RAZOR תחת פרוטוקול השוואה מחמיר: ΔlogL_total = 1155–1337 יחסית ל-DM_RAZOR.

(2) בדיקת הסגירה RCGGL מראה של-EFT יש עקביות חזויה חזקה יותר: ΔlogL_closure = 172–281, לעומת 127 עבור DM_RAZOR; וכאשר קבוצות RC-binGGL-bin מעורבבות באקראי, אות הסגירה קורס ל-6–23, מה שמראה שהאות תלוי במיפוי הבין־נתוני הנכון ולא בהתאמה מקרית.

(3) סריקות שיטתיות של σ_int, R_min ו-covariance shrinkage לא שינו את הסימן או את סדר הגודל של ״EFT עדיפה על DM_RAZOR״, ולכן המסקנה חסינה להפרעות מערכתיות נפוצות.

(4) נספח B (P1A) משדרג את קו בסיס ה-DM באותו פרוטוקול סגירה באופן ״סטנדרטי וניתן לביקורת״: נשמרות שלוש הרחבות חד־פרמטריות (SCAT/AC/FB), ונוספים hierarchical cM scatter + prior, proxy חד־פרמטרי ל-core וכיול גזירה m בצד העידוש (וכן השילוב DM_STD). התוצאות מראות שרק ענף feedback/core מביא שיפור נטו קטן בעוצמת הסגירה (122.21129.45, ΔΔlogL_closure≈+7.25), בעוד שאר ההרחבות אינן תורמות תרומה מובהקת או נותנות תרומה שלילית. לכן המסקנה העיקרית אינה תלויה בהנחה ש-DM_RAZOR הוא קו בסיס חלש מדי.

3 נתונים ועיבוד מוקדם

במחקר זה נעשה שימוש בשני סוגי נתונים ציבוריים, שהורדו, אומתו (sha256) ועובדו מראש בתוך המערכת באמצעות סקריפטים ניתנים למעקב. כדי להבטיח השוואה הוגנת בין מודלים, כל ה-workspaces (EFT_BIN / EFT_WEXP / EFT_WYUK / EFT_WPOW / DM_RAZOR) חולקים בדיוק את אותם תוצרי נתונים ואת אותו מיפוי תאים.


3.1 עקומות סיבוב (RC, SPARC)

נתוני RC מגיעים ממסד הנתונים SPARC, מקובצי Rotmod_LTG (175 קובצי rotmod). לאחר העיבוד המוקדם, במדגם ששימש למידול נכללו 104 גלקסיות וסך הכול 2295 נקודות נתונים (r, V_obs), שחולקו ל-20 תאי RC-bin לפי כללים כגון מסה כוכבית. כל נקודה כוללת רדיוס r (kpc), מהירות נצפית V_obs (km/s), שגיאת מדידה σ_obs, וכן רכיבי מהירות של גז/דיסקה/בליטה (V_gas, V_disk, V_bul).


3.2 עידוש חלש (GGL, KiDS-1000 / Brouwer+2021)

נתוני GGL משתמשים בצפיפות השטח האקוויוולנטית ΔΣ(R) מתוך Fig.3 אצל Brouwer ואחרים (2021) עבור KiDS-1000 (4 תאי מסה כוכבית, 15 נקודות R בכל תא), יחד עם הקווריאנציה המלאה שסופקה. במערכת ההנדסית נבנתה הקווריאנציה המקורית מסוג long-form מחדש כמטריצת 15×15 לכל תא, ובביקורת Stage-B אומתו הממדים והסבירות המספרית.


3.3 מיפוי RC-binGGL-bin וגודל המדגם הכולל

ארבעת תאי המסה של GGL מחוברים ל-20 תאי RC באמצעות מיפוי קבוע: כל GGL-bin מתאים ל-5 תאי RC-bin, ותרומת תאי RC משוקללת לפי מספר הגלקסיות. מיפוי זה נשמר ללא שינוי בכל המודלים והוא אילוץ הליבה של ההשוואה ההוגנת בבדיקת הסגירה ובהתאמה המשותפת. מספר נקודות הנתונים הסופי בניתוח המשותף הוא n_total = 2355 (RC=2295, GGL=60).

4 מודלים ושיטות סטטיסטיות


4.1 המפרט המתמטי המינימלי של EFT ו-DM (ניתן לביקורת/בדיקה)

סעיף זה מציג מפרט מתמטי מינימלי שניתן למימוש ישיר.

(a) מודל עקומות הסיבוב (RC)

לכל נקודת נתוני RC (r, V_obs, σ_obs) אנו משתמשים בסכימת רכיבים: V_mod²(r) = V_bar²(r) + V_extra²(r). כאן V_bar²(r) = V_gas²(r) + Υ_d·V_disk²(r) + Υ_b·V_bul²(r). בתוצאות העיקריות של המאמר נלקח Υ_d = Υ_b = 0.5 (בהתאם להמלצה האמפירית של SPARC, וגם כדי לצמצם דרגות חופש לא הכרחיות).

(b) תיקון הכבידה הממוצעת של EFT (EFT)

האיבר הנוסף של EFT מנוסח כ״ריבוע מהירות ממוצעת״: V_extra²(r) = V0_bin² · f(r/ℓ). כאן V0_bin הוא פרמטר אמפליטודה לכל RC-bin (20), ℓ הוא סולם גלובלי (1), ו-f(x) היא פונקציית קרנל חסרת ממד. צורות הקרנל המושוות כאן (כולן ללא דרגות חופש רציפות נוספות) הן:

מוטיבציה פיזיקלית (הרחבה): EFT מפרשת את תגובת הכבידה הנוספת בסקלת גלקסיות כתגובה אפקטיבית לאחר coarse-graining או ממוצע סקלות של פעולות מיקרוסקופיות במרחק סופי. במאמר זה איננו מניחים מנגנון מיקרוסקופי מסוים, אלא משתמשים בפרמטריזציה מינימלית וניתנת לביקורת כדי לבצע השוואה ובדיקה מבוקרות תחת פרוטוקול סטטיסטי אחיד.

לשם אינטואיציה, ניתן לכתוב את האיבר הנוסף גם בצורת תאוצה: a_extra(r)=V_extra²(r)/r=(V0_bin²/r)·f(r/ℓ). כאשר r≫ℓ, מתקבל f→1 ולכן V_extraV0_bin, כלומר תרומת מהירות נוספת כמעט שטוחה באזור החיצוני. כאשר r≪ℓ ו-f(x)x, אפשר להכניס סולם תאוצה אופייני a0,binV0_bin²/ℓ (עד כדי גורם קרנל מסדר O(1)), המספק אינטואיציית מעבר דמוית MOND בין האזור הפנימי לחיצוני.

משפחת הקרנלים הדיסקרטית שבה נעשה שימוש (none/exponential/yukawa/powerlaw_tail) יכולה להיתפס כ-proxy נמוך־ממד ל״שיפוע התחלתי/מהירות מעבר/זנב ארוך־טווח״ שונים, למשל סיכוך דמוי Yukawa לעומת תגובה בעלת זנב ארוך יותר. היא משמשת למבחן לחץ של חסינות, ולא למיצוי כל מרחב המודלים. בחלק של העידוש החלש אנו בונים מתוך V_avg(r) מסה וצפיפות מעטפת אקוויוולנטיות, ואז מטילים אותן לקבלת ΔΣ(R). יש להבין את הצפיפות האקוויוולנטית כתיאור אפקטיבי של פוטנציאל העידוש תחת הנחות של סימטריה כדורית ומיפוי שדה חלש (הפרטים המלאים הועברו לנספח A).

כל צורות הקרנל האלה מקיימות f(x)→1 כאשר x→∞ (כלומר רוויה V_extra²→V0²), וב-x≪1 הן נותנות גידול ליניארי או תת־ליניארי: למשל exponential: fx; yukawa: f0.5x; powerlaw_tail: f0.5x. לכן לצורות קרנל שונות יש הבדלים נצפים ברדיוסים קטנים — בשיפוע ההתחלתי, במהירות המעבר ובזנב החיצוני — שאפשר להבחין ביניהם באמצעות התאמה משותפת ובדיקת סגירה של RC+GGL.

תחזית EFT עבור ΔΣ(R) בעידוש חלש מתקבלת מהיפוך V_avg(r) למסת מעטפת וצפיפות, ואז מאינטגרל ההטלה: M_enc(r)=r·V_avg²(r)/G, ρ(r)=(1/4πr²)·dM_enc/dr, Σ(R)=2∫_R^∞ ρ(r)·r/√(r²−R²) dr, ΔΣ(R)=Σ̄(<R)−Σ(R). המימוש המספרי משתמש ברשת לוגריתמית ומעדן אותה אדפטיבית במקרי חריגה, כדי להבטיח יציבות ושחזוריות.

(c) DM_RAZOR: קו בסיס NFW להילות חומר אפל קר

במקביל אנו מדגישים כי DM_RAZOR מייצג רק קו בסיס NFW מינימלי וניתן לביקורת (cM קבוע וללא scatter; ללא Adiabatic Contraction, ללא feedback core, ללא אי־ספריות וללא איברי סביבה). כדי לצמצם את הסיכון של ״strawman baseline״, המאמר אינו טוען שאפקטים אלה אינם קיימים; להפך, הם נכללים בנספח B (P1A) כמבחן לחץ נמוך־ממד וניתן לביקורת, הכולל טיפול היררכי ב-cM scatter, proxy ל-core ופרמטר מטרד של כיול גזירה בצד העידוש.


4.2 פנקס מודלים והשוואה הוגנת (פרמטרים משותפים = הגדרת הסגירה)

מספר הפרמטרים באוסף ההשוואה העיקרי הוא: DM_RAZOR k=20; משפחת EFT k=21 (האחד הנוסף הוא log ℓ גלובלי). כל המודלים חולקים את אותם נתוני RC, אותם נתוני GGL וקווריאנציה, אותו מיפוי RC-binGGL-bin, אותו איבר בריוני ואותה המרת יחידות. בנוסף, צורות הקרנל (none / exponential / yukawa / powerlaw_tail) הן בחירה דיסקרטית ואינן מוסיפות פרמטרים רציפים, וכך נמנע יתרון הנובע מ״עוד דרגת חופש אחת״.


4.3 Likelihood, priors וסמפלר

ה-likelihood של RC הוא גאוסי אלכסוני: σ_eff² = σ_obs² + σ_int²; בתוצאות העיקריות נקבע σ_int=5 km/s, וב-Run-5 נסרק σ_int. ה-likelihood של GGL משתמש בגאוסי עם קווריאנציה מלאה לכל bin: logL_GGL = Σ_b log 𝒩(ΔΣ_obs^b | ΔΣ_mod^b, C_b). היעד המשותף הוא logpost(θ)=logprior(θ)+logL_RC(θ)+logL_GGL(θ). ה-priors מבטאים בעיקר גבולות פיזיקליים אפשריים (תחומי log ℓ, log V0 ו-log M200); כאשר מפעילים Υ חופשי ו-σ_int משתמשים ב-priors חלשי מידע (ראו פרטי המימוש והגדרות חבילת ה-release).

הסמפלר משתמש בהליכת אקראי adaptive block Metropolis: בכל צעד מתעדכן רק תת־בלוק אקראי של מרחב הפרמטרים כדי לשפר את שיעור הקבלה בממדיות גבוהה, וגודל הצעד מותאם קלות לפי שיעור הקבלה בחלון (יעד סביב 0.25). התוצאות העיקריות משתמשות במצב quick (למשל n_steps=800), וכל workspace מפיק trace, שאריות ואיורי PPC לביקורת ידנית וסקריפטית.


4.4 בדיקת סגירה וביקורת שלילית (הגדרה)

בדיקת הסגירה (Run-2) בוחנת, בלי להתאים מחדש את GGL, האם ״posterior של RC-only יכול לחזות GGL״. בפועל, על דגימות posterior של RC-only מייצרים קדימה ΔΣ(R) עבור 4 תאי GGL-bin ומחשבים logL_true בעזרת הקווריאנציה המלאה; לאחר מכן מבצעים permutation של מיפוי הקבוצות RC-binGGL-bin כדי לקבל logL_perm. עוצמת הסגירה מוגדרת כ-ΔlogL_closure≡⟨logL_true⟩−⟨logL_perm⟩. נוסף על כך, Run-10 מקבץ מחדש באקראי את 20 תאי RC-bin ל-4×5 (shuffle) ומחשב שוב את הסגירה, כדי לבדוק את תלות אות הסגירה במיפוי הנכון.

5 תוצאות עיקריות ופירוש


5.1 תוצאות עיקריות של ההתאמה המשותפת (RC+GGL)

best logL_total של ההתאמה המשותפת והיתרון היחסי ΔlogL_total (לעומת DM_RAZOR) מוצגים בטבלה S1a ובאיור S4. באוסף ההשוואה העיקרי, EFT_BIN משיג את היתרון המשותף הגדול ביותר (ΔlogL_total=1337.210), וגם צורות הקרנל האחרות של EFT שומרות על יתרון מובהק (1154.8271294.442). לפי קריטריוני המידע (AICc/BIC), משפחת EFT עדיפה אף היא משמעותית על DM_RAZOR, ולכן היתרון אינו נובע מהטיית מספר הפרמטרים.

הערה: התרומה העיקרית ל-ΔlogL_total≈1337 מגיעה מאיבר RC (בפירוק ה-joint, ΔlogL_RC≈1065, כ-80%). אפשר להבין זאת כשיפור מתון של Δχ²≈0.90 לכל נקודה מתוך N=2295 נקודות RC, המצטבר באופן טבעי בלikelihood גאוסי אלכסוני ליתרון מסדר 10^3. בה בעת, GGL ובדיקת הסגירה מספקים אילוצים עצמאיים בין מערכי הנתונים, והדירוג נשאר יציב תחת מבחני הלחץ σ_int, R_min ו-cov-shrink (ראו סעיף 6 וטבלה S1b).


5.2 תוצאות בדיקת הסגירה (RC-onlyGGL)

הגודל המרכזי של בדיקת הסגירה, ΔlogL_closure, מוצג בטבלה S1b ובאיור S3. עוצמת הסגירה של משפחת EFT היא 171.977280.513, גבוהה מ-126.678 של DM_RAZOR. המשמעות היא שכאשר לא מתירים שום דרגת חופש נוספת בין הנתונים, דגימות ה-posterior שמתקבלות עבור EFT מנתוני RC חוזות את נתוני GGL בעוצמה ניתנת להעברה גבוהה יותר.

הביקורת השלילית מחזקת עוד את הפירוש הפיזיקלי של אות הסגירה: כאשר מערבבים באקראי את קבוצות RC-binGGL-bin, עוצמת הסגירה של EFT יורדת ל-6–15 (עם הבדלים קלים בין קרנלים), בעוד שעוצמת הסגירה של קו הבסיס היא 172–281. ״קריסת האות״ הזאת שוללת יתרון מדומה שמקורו במימוש מספרי, בשגיאות יחידות או בטיפול לקוי בקווריאנציה.

איור R1 | ביקורת שלילית: לאחר shuffle של הקבוצות, אות הסגירה יורד באופן מובהק (מבוסס על מדדי Tab_Z1).


5.3 משמעות התוצאות ומגבלותיהן

מסקנת המחקר היא: ״במערך הנתונים ובפרוטוקול הזה, תיקון הכבידה הממוצעת של EFT עדיף על קו הבסיס DM_RAZOR שנבדק״. יש להדגיש כי בצד ה-DM נעשה שימוש רק בקו בסיס NFW מינימלי וביחס c(M) קבוע, ללא core, ללא אי־ספריות, ללא איברי סביבה וללא מודלי חיבור גלקסיה–הילה מורכבים יותר. לכן מאמר זה אינו טוען שהוא שולל את כל משפחות מודלי ה-DM; הוא מספק קו בסיס ניגודי, ניתן לשחזור וממוקד בבדיקת סגירה, כדי להעריך אם RC ו-GGL ניתנים להסבר עקבי באמצעות אותה מערכת פרמטרים ומיפוי בין־נתוני.

כדי להשיב על שאלה נפוצה זו, השלמנו פרויקט הרחבה עצמאי P1A (ראו נספח B), שבו מחזקים את קו בסיס ה-DM באופן ״סטנדרטי וניתן לביקורת״ בלי לשנות את המיפוי המשותף RC-binGGL-bin ואת מסגרת הביקורת: מעבר לשלוש הרחבות חד־פרמטריות (SCAT/AC/FB), נוספו (i) hierarchical cM scatter + massconcentration prior (DM_HIER_CMSCAT), (ii) proxy חד־פרמטרי ל-baryonic-feedback core (DM_CORE1P), ו-(iii) פרמטר מטרד m לכיול גזירה בצד העידוש החלש (DM_RAZOR_M), וכן מודל משולב DM_STD; EFT_BIN נשמר כייחוס להשוואה.

DM_RAZOR_SCAT (cM scatter) — מכניס פרמטר פיזור ריכוזים halo-to-halo, σ_logc, כדי לבדוק אם יחס c(M) קבוע גורם להערכת חסר שיטתית של יכולת ההסבר של DM;
DM_RAZOR_AC (Adiabatic Contraction) — משתמש בפרמטר יחיד α_AC לאינטרפולציה רציפה בין ״אין התכווצות״ לבין ״התכווצות סטנדרטית״, בעלות מינימלית, כדי ללכוד את מגמת ההתכווצות הפנימית הנגרמת על ידי בריונים;
DM_RAZOR_FB (Feedback / core) — משתמש בסקלת core (למשל log r_core) כדי לתאר את דיכוי עקומת הסיבוב עקב core באזור הפנימי, תוך שמירה על קירוב NFW בסקלת העידוש החלש.

ה-scoreboard הכמותי של P1A מופיע בנספח B, טבלה B1 / איור B1 (נוצר אוטומטית מ-Tab_S1_P1A_scoreboard). במדד הסגירה, DM_RAZOR_FB נותן שיפור נטו קטן (122.21129.45, +7.25), ושאר ההרחבות אינן תורמות לעוצמת הסגירה באופן מובהק או נותנות תרומה שלילית. בצד ההתאמה המשותפת, הכנסת hierarchical cM scatter prior (DM_HIER_CMSCAT) או המודל המשולב (DM_STD) משפרת משמעותית את joint logL, אך אינה משפרת את עוצמת הסגירה; הדבר מרמז שהתרומה העיקרית היא גמישות בהתאמה המשותפת ולא יכולת העברה בין בדיקות. לכן יש להבין את מסקנת הליבה של גוף המאמר כך: תחת אילוצי מיפוי משותף ובדיקת סגירה קשיחים, יתרון העקביות הבין־נתונית של EFT אינו נובע מבחירה בקו בסיס DM ״חלש מדי״. חבילת הפרסום של P1A בנספח B (טבלאות/איורים משלימים ו-full_fit_runpack) תצורף כקובצי עזר לאותו Zenodo Concept DOI של ה-full_fit_runpack של המאמר: https://doi.org/10.5281/zenodo.18526286.

6 חסינות וניסויי ביקורת


6.1 סריקת σ_int (Run-5)

ביצענו סריקה שיטתית של הפיזור הפנימי σ_int של RC, ובכל ערך של σ_int חזרנו על ההיסק המשותף וחישבנו את ΔlogL_total יחסית ל-DM_RAZOR. ערכי המינימום/המקסימום של ΔlogL_total לכל מודל בטווח הסריקה מופיעים בטבלה S1b.

איור R2 | טווח ΔlogL_total תחת סריקת σ_int (גדול יותר עדיף).


6.2 סריקת R_min (Run-6)

כדי לבדוק את השפעת שגיאות המערכת באזור המרכזי (למשל תנועה לא־מעגלית, רזולוציה או מידול בריוני לא מספק), חתכנו את נתוני RC לפי סף R_min וחזרנו על ההיסק המשותף. יתרון משפחת EFT נשאר חיובי ויציב בסדר הגודל לאורך סריקת R_min.

איור R3 | טווח ΔlogL_total תחת סריקת R_min (גדול יותר עדיף).


6.3 סריקת cov-shrink (Run-7)

כדי לבדוק אי־ודאות בקווריאנציה של GGL, החלנו shrinkage על מטריצת הקווריאנציה של כל תא מסה: C_α=(1−α)C+α·diag(C), וסרקנו את α. התוצאות מראות שיתרון משפחת EFT אינו רגיש לטיפול זה.

איור R4 | טווח ΔlogL_total תחת סריקת cov-shrink (גדול יותר עדיף).


6.4 סולם אבלציה (Run-8)

בתוך EFT_BIN ביצענו אבלציה מקוננת: ממודל מינימלי מאוד (ללא פרמטרים חופשיים), דרך שמירה על מעט דרגות חופש בלבד, ועד מודל מלא עם אמפליטודות 20-bin וסולם גלובלי. AICc/BIC מראים כי EFT_BIN המלא נחוץ באופן מובהק להסבר הנתונים.

איור R5 | סולם האבלציה של EFT_BIN (AICc, קטן יותר עדיף).


6.5 חיזוי בהשארה בחוץ (Run-9)

בנוסף ביצענו בדיקת leave-one-bin-out (LOO): בכל פעם הושאר בחוץ אחד מארבעת תאי המסה של GGL, ההיסק חושב מחדש על שאר התאים (ועל כל RC), ואז הוערכה הלוג־סבירות של התא שהושאר בחוץ. מדדי הסיכום מופיעים בטבלה המשלימה Tab_R3_leave_one_bin_out (תוצר Run-9; דפוסי נתיבי הקובץ מופיעים ברשימת התוצרים המרכזיים בסעיף 8.2), ומשפחת EFT עדיין עדיפה בבירור על DM_RAZOR גם במקרה ההשארה הגרוע ביותר.

איור R6 | LOO: התפלגות הלוג־סבירות של התא שהושאר בחוץ (מתוצרי Run-9).


6.6 ביקורת שלילית: RC-bin shuffle (Run-10)

Run-10 מקבץ מחדש באקראי את 20 תאי RC-bin ל-4×5, ומחשב מחדש את הסגירה תוך שמירה על posterior ה-RC-only ללא שינוי. התוצאות מראות כי בהשוואה למיפוי המקורי, shuffle מפחית משמעותית את mean logL_true ואת ΔlogL_closure של הסגירה (ראו טבלה S1b ואיור R1), ובכך מחזק עוד את יכולת הפירוש של אות הסגירה.

איור R7 | ביקורת שלילית: מיפוי shuffle גורם לירידה ברורה ב-mean logL_true של הסגירה (מתוצרי Run-10).

7 עקיבות וביקורת עקביות (Provenance)

כל המספרים המצוטטים במאמר ניתנים למעקב פרטני בטבלאות הסיכום הקפדניות ובמסמכי הביקורת של ארכיון הפרסום. כדי לשמור על קריאה רציפה בגוף המאמר, שרשרת העקיבות המלאה (רשימת tags, טבלאות ביקורת, רשימת checksum ושיטת בדיקה) הועברה לנספח A.

8 שחזוריות וארכיון Zenodo (Reproducibility & Archive)

הצהרת זמינות נתונים וקוד: נתוני עקומות הסיבוב SPARC ונתוני העידוש החלש KiDS-1000 שבהם השתמשנו הם נתונים ציבוריים. הדוח ברמת פרסום הופקד ב-Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526334), וחבילת השחזור המלאה הופקדה ב-Zenodo (Concept DOI: https://doi.org/10.5281/zenodo.18526286). שלבי ההרצה המפורטים, סביבת התלויות, רשימת הארכיון ומידע אימות ה-hash מופיעים בנספח A; תכנון מבחן הלחץ לסטנדרטיזציה של קו בסיס DM (P1A), תגי ההרצה ותוצריו מופיעים בנספח B.

תחת אותו Concept DOI של חבילת השחזור המלאה (https://doi.org/10.5281/zenodo.18526286) אנו מספקים שתי כניסות שחזור לפי שימוש:
P1 (גוף המאמר) full_fit_runpack: משחזר את RC-only / closure / joint ואת סריקות החסינות של EFT מול DM_RAZOR, ומפיק את טבלאות S1a/S1b ואת האיורים S3/S4 שבגוף המאמר;
P1A (נספח B) full_fit_runpack: משחזר את מבחן הלחץ לסטנדרטיזציה של קו בסיס DM (SCAT/AC/FB + hierarchical cM scatter prior + core1p + lensing m + DM_STD; כולל השוואה ל-EFT_BIN), ומפיק את טבלה B1 ואת איור B1.
הטבלאות/האיורים המשלימים של P1A וה-full_fit_runpack יצורפו כקבצי עזר לאותו Concept DOI, כדי לשמור על שער ארכיון יחיד.

9 תודות והצהרות


9.1 תודות

אנו מודים לצוותי SPARC ו-KiDS-1000 על הנתונים והמסמכים הציבוריים; ותודה למשתתפים בתהליכי השחזור והביקורת של פרויקט זה.


9.2 תרומת המחבר

Guanglin Tu אחראי להצעת הקונספט, לתכנון המחקר, למימוש ההנדסי, לארגון הנתונים, לניתוח הפורמלי, למימוש תהליך השחזור והביקורת, וכן לכתיבת המאמר.


9.3 מקורות מימון

המחבר Guanglin Tu מימן את העבודה מכספו האישי (ללא מימון חיצוני/ללא מספר מענק).


9.4 ניגודי עניינים

למחבר Guanglin Tu יש קשר עם "EFT Working Group, Shenzhen Energy Filament Science Research Co., Ltd. (סין)"; אין ניגודי עניינים נוספים.


9.5 סיוע AI

נעשה שימוש ב-OpenAI GPT-5.2 Pro וב-Gemini 3 Pro לליטוש לשוני, לעריכה מבנית ולארגון תהליך השחזור; הם לא שימשו ליצירה או שינוי של נתונים, תוצאות, איורים או קוד; לא שימשו ליצירת הפניות; המחבר נושא באחריות מלאה לכל תוכן המאמר ולדיוק ההפניות.

10 מקורות

נספח A: פרטי עקיבות ושחזוריות

נספח זה מרכז את מידע העקיבות והשחזוריות המיועד לארכיון ארוך־טווח (תגי הרצה, תוצאות ביקורת, רשימות ארכיון ונקודות בדיקה), כדי שהקוראים יוכלו לבדוק ולשחזר לפי הצורך.


A.1 פרטי עקיבות וביקורת

כדי להבטיח עקיבות ארוכת־טווח, הפרויקט משתמש בכל הרצה ובכל תוצר בתגי זמן, ושומר תוצרים היסטוריים בלי לדרוס אותם. המספרים המרכזיים המצוטטים במאמר מגיעים מן הסיכום הקפדני (compile_tag=20260205_035929), שכבר עבר את בדיקות העקביות הבאות:

• כל הטבלאות השלביות נושאות run_tag ו-stage tag; סקריפט הסיכום הקפדני בוחר מתוך report/tables מקורות טבלה canonical מלאים ועקביים.

• הערכים ב-Tab_Z1_master_summary וב-Tab_Z2_conclusion_highlights הושוו פרטנית לטבלאות ה-canonical שנבחרו.

• בעת יצירת ה-PDF בוצעה ביקורת tags על הטבלאות/האיורים המצוטטים, כדי לוודא שלא נעשה ערבוב של תוצרים ישנים.

תגים מרכזיים (לאיתור כל תוצרי הביניים): run_tag=20260204_122515; closure_tag=20260204_124721; joint_tag=20260204_152714; sigma_sweep_tag=20260204_161852; rmin_sweep_tag=20260204_195247; covshrink_tag=20260204_203219; ablation_tag=20260204_214642; LOO_tag=20260204_224827; negctrl_tag=20260204_234528; strict_compile_tag=20260205_035929; release_tag=20260205_112442.

תוצאות ביקורת העקביות: Tab_AUDIT_checks_strict מציגה pass=9, fail=0, skip=0 (ראו את חבילת ה-release לפרטים).


A.2 שלבי ביצוע לשחזור ורשימת ארכיון

מחקר זה משתמש במערכת שחזור הכוללת ״דוח ברמת פרסום + חומר משלים של טבלאות ואיורים + חבילת הרצה מלאה שניתן להריץ מחדש״. הקוראים יכולים לעיין ישירות ב-Tables & Figures Supplement כדי לבדוק את כל נכסי הטבלאות/האיורים המצוטטים במאמר; מי שמעוניין לשחזר מאפס את המספרים ואת שרשרת הביקורת יכול להשתמש ב-full_fit_runpack כדי להוריד נתונים ולהריץ מחדש את כל התהליך (בסיום ההרצה ניתן להשתמש בסקריפט ההשוואה מול טבלאות reference שבתוך החבילה כדי לאמת עקביות ערכים בטבלאות).


A.2.1 שחזור Quickstart (RUN_FULL, Windows PowerShell)

סעיף זה מציג נתיב שחזור קצר יותר (Windows PowerShell). לבדיקה מהירה מומלץ לעיין ישירות ב-Tables & Figures Supplement ולבדוק פרטנית את הטבלאות והאיורים המצוטטים במאמר. לשחזור מקצה לקצה ולהפקת כל הטבלאות/האיורים ותוצרי הביקורת, השתמשו ב-full_fit_runpack: לפי README/ONE_PAGE_REPRO_CHECKLIST שבתוך החבילה, הריצו verify_checksums.ps1 ואת RUN_FULL.ps1 (מומלץ Mode=full).

שער ארכיון Zenodo (Concept DOI): https://doi.org/10.5281/zenodo.18526286.
תגי השרשרת הראשית של מאמר זה: run_tag=20260204_122515, strict compile_tag=20260205_035929, release_tag=20260205_112442.


A.2.2 חומרי ארכיון ונקודות בדיקה מרכזיות (Packages & checks)

ארכיון Zenodo מספק שלושה סוגי חומרים משלימים: (1) דוח ברמת פרסום (המאמר הנוכחי, v1.1; כולל נספח B: מבחן לחץ לסטנדרטיזציה של קו בסיס DM ב-P1A); (2) Tables & Figures Supplement (חומר משלים של טבלאות ואיורים: מכסה את כל נכסי הטבלאות/האיורים המצוטטים במאמר; בנפרד עבור P1 ו-P1A); (3) full_fit_runpack (חבילת שחזור מלאה: הורדת נתונים מאפס והרצת כל התהליך מחדש; בנפרד עבור P1 ו-P1A). מתוכם (1)(2) תומכים בקריאה מהירה ובבדיקה עצמאית, ו-(3) מספק יכולת שחזור מלאה מקצה לקצה.

קטגוריית חומר

שם קובץ (דוגמה)

שימוש ומיקום (מומלץ להשתמש בסדר זה)

דוח ברמת פרסום (עברית ואנגלית)

P1_RC_GGL_report_EN_PUBLICATION_V1_1.pdf
P1_RC_GGL_report_CN_PUBLICATION_V1_1.pdf

דוח מלא בארכיון Zenodo; גוף המאמר מציג את המסקנות העיקריות ואת ביקורת החסינות, ונספח B מציג את P1A (מבחן לחץ לסטנדרטיזציה של קו בסיס DM).

Tables & Figures Supplement(P1)

P1_RC_GGL_supplement_figs_tables_V1_1.zip

כל הטבלאות (CSV) והאיורים (PNG) המצוטטים בגוף המאמר, כולל סקריפטים ליצירה וקובצי tags.

Tables & Figures Supplement(P1A)

P1A_supplement_figs_tables_v1.zip

כל הטבלאות והאיורים המצוטטים בנספח B (P1A), כולל Tab_S1_P1A_scoreboard ו-Fig_S1_P1A_scoreboard.

full_fit_runpack(P1)

P1_RC_GGL_full_fit_runpack_v1_1.zip

שחזור מלא מקצה לקצה: הורדת נתונים מאפס והרצה מחדש של RC-only/closure/joint וסריקות החסינות.

full_fit_runpack(P1A)

P1A_RC_GGL_full_fit_runpack_v1.zip

שחזור מלא מקצה לקצה (נספח B): הרצה מחדש של DM 7+1 + DM_STD (כולל השוואת EFT_BIN) והפקת נכסי הנספח; החבילה כוללת סקריפט השוואה מול טבלאות reference לאימות עקביות ערכי הטבלאות.

המלצת ציטוט: כאשר מצטטים מאמר זה או את חומרי השחזור הנלווים, יש לציין את Zenodo Concept DOI (https://doi.org/10.5281/zenodo.18526334).

לאחר השחזור אמורים להופיע, ולהיות ניתנים להשוואה, התוצרים המרכזיים הבאים:

נספח B: P1A — מבחן לחץ לסטנדרטיזציה של קו בסיס DM (DM 7+1 + DM_STD; כולל השוואת EFT)

נספח זה מתעד פרויקט הרחבה (P1A) התואם לפרוטוקול הסגירה של גוף המאמר. מטרתו היא, בלי להכניס מספר רב של דרגות חופש ובלי לשנות את מיפוי RC-binGGL-bin או את מסגרת הביקורת, לשדרג את ה-DM_RAZOR המינימלי שבו השתמש גוף המאמר (NFW + cM קבוע, ללא scatter/ללא התכווצות/ללא core) לאוסף קווי בסיס DM קרוב יותר לפרקטיקה אסטרופיזיקלית ועמיד יותר לטענות נפוצות. P1A מכסה ומרחיב את מבחן הלחץ התלת־ענפי הקודם: לצד שמירת SCAT/AC/FB, הוא מוסיף hierarchical cM scatter + prior, proxy חד־פרמטרי ל-core ופרמטר מטרד m לכיול גזירה בצד העידוש, וכן מספק מודל משולב DM_STD; EFT_BIN נשמר כייחוס להשוואה.

הבהרה משלימה: עוצמת הסגירה ומספרים דומים בנספח B (P1A) משתמשים בתקציב Monte Carlo גבוה יותר (למשל ndraw=400, nperm=24), השונה מתקציב ה-quick שבגוף המאמר לכיסוי כל משפחת קרנלי EFT (למשל ndraw=60, nperm=12). לכן ייתכן שהערכים המוחלטים ינועו ברמת O(10) עקב דגימה; אך ההשוואות בין מודלים בתוך אותה טבלה ובאותו תקציב הן הוגנות, וסימן היתרון וסדר הגודל נשארים יציבים בין תקציבים שונים.


B.1 מטרה ומיקום (Why P1A, and why as an Appendix)

P1A אינו מנסה למצות את כל אפשרויות מידול הילות ΛCDM (כגון אי־ספריות, תלות בסביבה, חיבור מורכב בין גלקסיות להילות או baryon physics בעלת ממדיות גבוהה). במקום זאת, P1A נוקט עיקרון ״נמוך־ממד, ניתן לביקורת וניתן לשחזור״: כל מודול שדרוג מוסיף רק ≤1 פרמטר אפקטיבי מרכזי, וממשיך לעמוד בשלושת האילוצים הקשיחים של המאמר:
(i) פנקס פרמטרים: כל פרמטר חדש חייב להירשם במפורש ולדווח יחד עם קריטריוני המידע (AICc/BIC);
(ii) מיפוי משותף: עדיין משתמשים באותו מיפוי קבוצות RC-binGGL-bin, ואין להתיר ״כיוונון מיפוי״ עבור מערך נתונים יחיד;
(iii) בדיקת סגירה: כל שדרוג חייב להציג רווח אמיתי ביכולת החיזוי המועברת RCGGL, ולא רק שיפור בהתאמת RC-only.


B.2 DM 7+1 + DM_STD: הגדרת מודולים, פרמטרים והכניסה ל-posterior המשותף

P1A, כ-runpack עצמאי, מספק 8 workspaces של DM (DM 7+1) ועוד השוואת EFT אחת: החל מ-DM_RAZOR כקו בסיס, נבנות שלוש הרחבות legacy חד־פרמטריות (DM_RAZOR_SCAT / DM_RAZOR_AC / DM_RAZOR_FB), ונוספים שלושה מודולי הגנה סטנדרטיים יותר (DM_HIER_CMSCAT / DM_CORE1P / DM_RAZOR_M), ולאחר מכן ניתן המודל המשולב DM_STD. המטרה המשותפת של המודולים היא לכסות, תוך מזעור הגדלת הממדיות, את שלוש הטענות הנפוצות ביותר: (a) כיצד פיזור ו-prior של יחס cM נכנסים למודל היררכי; (b) האם האפקט העיקרי של baryonic feedback ניתן לייצוג באמצעות proxy חד־פרמטרי ל-core; (c) האם שגיאת מערכת מרכזית בצד העידוש עלולה להיקרא בטעות כאות פיזיקלי.

Workspace

dm_model

פרמטר חדש (≤1)

מוטיבציה פיזיקלית (ליבה)

עקרון מימוש (ידידותי לביקורת)

DM_RAZOR

NFW (fixed cM, no scatter)

קו בסיס הילות ΛCDM מינימלי וניתן לביקורת; משמש להשוואה מחמירה מול EFT

המיפוי המשותף קבוע; פנקס הפרמטרים קשיח; משמש כ-baseline רק להשוואה יחסית

DM_RAZOR_SCAT

NFW + cM scatter(legacy)

σ_logc

ביחס cM קיימת פיזוריות; מקורבת באמצעות log-normal scatter בפרמטר אחד

≤1 פרמטר חדש; עדיין משתמש במיפוי משותף; רווח הסגירה הוא קריטריון הקבלה

DM_RAZOR_AC

NFW + Adiabatic Contraction(legacy)

α_AC

כניסת בריונים עשויה לגרום להתכווצות אדיאבטית של ההילה; מקורבת בעוצמה חד־פרמטרית

≤1 פרמטר חדש; המיפוי אינו משתנה; מדווחים שינויי AICc/BIC ורווח סגירה

DM_RAZOR_FB

NFW + feedback core(legacy)

log r_core

feedback עשוי ליצור core באזור הפנימי; מקורב באמצעות סקלת core חד־פרמטרית

≤1 פרמטר חדש; סגירה/ביקורת שלילית באותו פרוטוקול; שיפור RC-only אינו היעד היחיד

DM_HIER_CMSCAT

Hierarchical cM scatter + prior

σ_logc(hier)

מבנה היררכי סטנדרטי יותר c_ilogN(c(M_i),σ_logc); משפיע בו־זמנית על posterior משותף של RC ו-GGL

prior מפורש; c_i סמוי עובר marginalization; עדיין שומר על ממדיות נמוכה וביקורתיות

DM_CORE1P

1‑parameter core proxy (coreNFW/DC14inspired)

log r_core

proxy חד־פרמטרי ל-core מייצג את האפקט העיקרי של baryonic feedback, כדי להימנע מפרטי יצירת כוכבים עתירי ממדיות

מפנה לספרות סטנדרטית; ≤1 פרמטר חדש; קשור ישירות לבדיקת הסגירה

DM_RAZOR_M

NFW + lensing shearcalibration nuisance

m_shear(GGL)

שגיאת מערכת מרכזית בצד העידוש החלש נספגת בפרמטר אפקטיבי, כדי להפחית את הסיכון ל״קריאת שגיאת מערכת כפיזיקה״

ה-nuisance נרשם במפורש; אין לאפשר לו להשפיע לאחור על RC; התוצאות נבחנות בעיקר לפי חסינות הסגירה

DM_STD

Standardized DM baseline (HIER_CMSCAT + CORE1P + m)

σ_logc + log r_core (+ m_shear)

שלוש הטענות הנפוצות ביותר נכנסות יחד לקו בסיס סטנדרטי אחד שעדיין נשאר נמוך־ממד

פנקס פרמטרים וקריטריוני מידע מדווחים יחד; הסגירה היא המדד המרכזי; משמש כהשוואת ההגנה החזקה ביותר בצד ה-DM

הערה: שמות הפרמטרים שלעיל נקבעים לפי המימוש ההנדסי (למשל σ_logc, α_AC, log r_core, m_shear). מוקד התכנון של P1A הוא ״לחזק מעט את קו הבסיס של DM, אך להשאירו ניתן לביקורת״, ולא להפוך את צד ה-DM למתאם גבוה־ממד ולא נשלט. בפרט, DM_HIER_CMSCAT מכניס cM scatter בצורה היררכית: לכל halo מוגדר ריכוז c_i עם פיזור log-normal סביב c(M_i), והוא מוגבל באמצעות σ_logc גלובלי ו-prior של c(M); המבנה ההיררכי הזה משפיע בו־זמנית על posterior משותף של RC ו-GGL.


B.3 פרוטוקול סטטיסטי ותוצרי מדידה התואמים לגוף המאמר

P1A משתמש מחדש בכל תוצרי הנתונים, במיפוי המשותף ובמסגרת הביקורת של גוף המאמר; סדר הביצוע ותצורת התוצרים נשארים זהים:
(1) Run‑1: היסק RC-only (מפיק posterior_samples.npz ו-metrics.json);
(2) Run‑2: בדיקת סגירה RCGGL (מפיק closure_summary.json ו-permuted baseline);
(3) Run‑3: התאמה משותפת RC+GGL (מפיק joint_summary.json).
כל המספרים המצוטטים מגיעים מטבלת הסיכום האוטומטית (Tab_S1_P1A_scoreboard), וניתנים לאימות באמצעות P1A full_fit_runpack לאחר הרצה מלאה מחדש עם סקריפט ההשוואה הפנימי מול טבלאות reference.


B.4 תוצאות עיקריות, שערי טבלאות/איורים ותכנית ארכיון (אותו DOI)

סעיף זה מציג את המסקנות הכמותיות המרכזיות של P1A. טבלה B1 מסכמת את מדדי המפתח של RC-only, סגירת RCGGL וההתאמה המשותפת RC+GGL (בסוגריים: ההפרש יחסית ל-baseline של DM_RAZOR). עוצמת הסגירה מוגדרת כ-ΔlogL_closure ≡ ⟨logL_true⟩ − ⟨logL_perm⟩ (גדול יותר עדיף). איור B1 מציג את אותו scoreboard באופן חזותי. עיקרי המסקנות הם:
• מבין שלושת ענפי legacy, רק DM_RAZOR_FB (feedback/core) נותן שיפור נטו קטן בעוצמת הסגירה: 122.21129.45 (+7.25); SCAT ו-AC אינם נותנים רווח נטו;
• ל-DM_HIER_CMSCAT ול-DM_RAZOR_M החדשים יש השפעה קטנה מאוד (~0) על עוצמת הסגירה, וגם DM_CORE1P אינו מציג רווח נטו מובהק;
• המודל המשולב DM_STD יכול לשפר מאוד את joint logL (קרוב יותר לאופטימום ההתאמה המשותפת), אך עוצמת הסגירה דווקא יורדת; הדבר מרמז שהשיפור העיקרי מגיע מגמישות ההתאמה המשותפת ולא מיכולת העברה בין בדיקות;
EFT_BIN, כנקודת ייחוס, עדיין שומר על יתרון ברור בעוצמת הסגירה ובהתאמה המשותפת. לכן המסקנה המרכזית של גוף המאמר נשארת חסינה גם לאחר הכנסת ״קו בסיס DM חזק יותר + nuisance בעידוש״.

כדי לאפשר השוואה ישירה עם ההשוואה העיקרית בגוף המאמר, Tab S1aS1b בגוף המאמר מסכמות את תוצאות ההשוואה הקפדנית בין משפחת EFT לבין DM_RAZOR: מודלי EFT משפרים את ΔlogL_total≈1155–1337 יחסית ל-DM_RAZOR בהתאמה המשותפת, ומגיעים ל-ΔlogL_closure=172–281 בבדיקת הסגירה. P1A הוא רק ״השוואה קשה יותר״ בצד ה-DM; תפקידו להחליש טענות מסוג ״strawman baseline / systematics-as-physics״, ולא להחליף את ההשוואה העיקרית בגוף המאמר.

טבלה B1 | scoreboard של P1A (גדול יותר עדיף; בסוגריים הפרש יחסית ל-baseline של DM_RAZOR).

ענף מודל (workspace)

Δk

RC-only best logL_RC (Δ)

עוצמת סגירה ΔlogL_closure (Δ)

Joint best logL_total (Δ)

DM_RAZOR

0

-15702.654 (+0.000)

122.205 (+0.000)

-27347.068 (+0.000)

DM_RAZOR_SCAT

1

-15702.294 (+0.361)

121.236 (-0.969)

-23153.311 (+4193.758)

DM_RAZOR_AC

1

-15703.689 (-1.035)

121.531 (-0.674)

-23982.557 (+3364.511)

DM_RAZOR_FB

1

-15496.046 (+206.609)

129.454 (+7.249)

-27478.531 (-131.463)

DM_HIER_CMSCAT

1

-15702.644 (+0.010)

121.978 (-0.227)

-23153.160 (+4193.908)

DM_CORE1P

1

-15723.158 (-20.504)

122.056 (-0.149)

-27336.258 (+10.810)

DM_RAZOR_M

0 (+m)

-15702.654 (+0.000)

122.205 (+0.000)

-27340.451 (+6.617)

DM_STD

2 (+m)

-15832.203 (-129.549)

105.690 (-16.515)

-22984.445 (+4362.623)

EFT_BIN

1

-14631.537 (+1071.117)

204.620 (+82.415)

-19001.142 (+8345.926)

איור B1 | scoreboard של P1A: ΔlogL של סגירה ושל התאמה משותפת יחסית ל-baseline (גדול יותר עדיף).

קבוצת תגי הדוגמה של ההרצות שהושלמו עבור נספח זה היא:
P1A run_tag = 20260213_151233; P1A closure_tag = 20260213_161731; P1A joint_tag = 20260213_195428.


B.5 אופן ציטוט מומלץ (Appendix citation note)

כאשר קוראים צריכים לצטט את ״מבחן הלחץ לסטנדרטיזציה של קו בסיס DM״ מעבר למסקנות העיקריות של גוף המאמר, מומלץ לציין לצד המסקנה העיקרית: 'See Appendix B (P1A) for standardized DM baseline stress tests (legacy SCAT/AC/FB + hierarchical cM scatter prior + core proxy + lensing shear-calibration nuisance), under the same closure protocol.'