לוח בקרה

מזהה דוא"ל תפקיד מכסת העלאות ברירת מחדל נוצר אישור תנאים פעולות
ניהול תחומים
מסמכים ללא תחום
שם קובץתגיותתאריך
שם תיאור אייקון צבע מסמכים סטטוס פעולות

אין תחומים מוגדרים

כללי ניתוח

לא הוגדרו כללי ניתוח

ניהול שדות מערכת
מפתח טכני שם תצוגה נצפה לראשונה מסמכים פעולות

לא נמצאו שדות. העלה מסמך או לחץ "רענן שדות".

מאגר חוקים
מזהה שם החוק כינויים / שמות נפוצים מסמכים נוצר פעולות

מאגר החוקים ריק. הוסף חוקים כדי לאפשר זיהוי אוטומטי.

מאגר סעיפים
מזהה חוק מספר סעיף שם הסעיף / עבירה כינויים פעולות

מאגר הסעיפים ריק. הוסף סעיפים או השתמש בייצור אוטומטי.

איחוד ערכים

אחד ערכים דומים בשדה אחד לערך קנוני אחד. ההתאמה חלה גם על חיפוש וגם על תצוגת גרפים.

ערכים קיימים
ערךמסמכים
טיוב נתונים

מיפוי מבנה הנתונים לפי תחום. לחץ/י "מפה מחדש" כדי לסרוק את כל המסמכים בתחום ולבנות מפת שדות.


                
שם שדה סוג התנהגות כיסוי ערכים ערכים נפוצים טווח מספרי
בחר תחום ולחץ "מפה מחדש" כדי להתחיל
דירוג חומרת ענישה
ערכים לא ממופים
סדר דרגה סוג עונש ערכים גולמיים ממופים פעולות

אין סוגי עונש מוגדרים.

ייבוא אוטומטי
מסך זה מנהל הגדרות ייבוא (תזמון, מקור, פרמטרים). לתצוגה חיה של ריצות פעילות והתור של court_downloader, ראה Worker חי .
רצות אוטומטית בתזמון קבוע 0
לחיצה על שורה מציגה את הריצות האחרונות
שם / תחום מקור תדירות מצב ריצה אחרונה ייבוא אחרון פעולות
הפעלה ידנית בלבד 0
שם / תחום מקור תדירות מצב ריצה אחרונה ייבוא אחרון פעולות
ייבוא נתונים חיצוניים
העלאת קובץ Excel/CSV עם רשימת שדות ביחס לכל תיק. הנתונים נשמרים בטבלה נפרדת (external_dataset_rows) ומחוברים למסמכים לפי עמודה שתבחר (כברירת מחדל: case_number). יחס 1:N נתמך — תיק עם כמה שורות יקבל כמה רשומות.
שם מזהה (key) תחום עמודת מזהה שורות תואמו לא תואמו תאריך ייבוא פעולות
אין דאטה-סטים מיובאים.
תור עיבוד LLM
# מסמך משתמש ספק סטטוס עדיפות המתנה זמן עיבוד נכנס לתור התחיל הסתיים פעולה
משימות גירוד
טבלה זו מציגה את ההיסטוריה של משימות הגירוד. לתצוגה חיה בזמן-אמת של מה שרץ עכשיו וה-workers המחוברים, ראה Worker חי .
סוג תיאור סטטוס CD סטטוס ייבוא קבצים מקור בוקש הושלם פעולות
Worker חי
Workers פעילים 0
Worker ID Caps Last poll Current job User-Agent
אין workers פעילים בחלון זמן הזיהוי.
רץ עכשיו 0
Type CD job Worker פרמטרים קבצים התקדמות שאילתות DMS run זמן
אין ג'ובים פעילים.
ממתינים בתור 0
# Type CD job פרמטרים DMS run נוצר
התור ריק.
משימות Workers
Download
Extract (PDF → MD)
LLM
Workers שראינו לאחרונה
worker_id stage executor פעיל עכשיו? משימות נראה לאחרונה lease עד
טוען…
Download — משימות הורדה
#docstatusexecutor worker_idproviderpayload נוצרסייםמשךפעולות
Extract — המרה ל-MD
#docstatusexecutor worker_idextractorchars leaseנוצרסייםמשךפעולות
LLM — ניתוח AI
#docstatusexecutor worker_idproviderשגיאה leaseנוצרסייםמשךפעולות
כפילויות
סימון רך — הסתרה במקום מחיקה חדש

מסמן כפילויות במקום למחוק אותן. השורות המסומנות נשארות ב־DB אך נעלמות מכל הממשקים למשתמש. כולל זיהוי לפי תוכן זהה — תופס מסמכים שבית המשפט מייצר מחדש כ־PDFים שונים אך עם טקסט זהה (כמו 88880/78531/59581 שלך).

מחיקה ישירה (מורשת)
ID קובץ עמודים טקסט AI תחום תאריך העלאה
מבנה נתונים
טבלאות
טוען...
בונה שאילתות

אין תוצאות עדיין
מסלול המידע במערכת
מפה ויזואלית של כל מסלולי הקליטה והעיבוד — מהמקור (העלאה / יבוא / גירוד) ועד היעד הסופי (טבלאות, AI analysis, אזכורי חוק). כל שלב צבוע אחרת לפי סוג.
1
מקורות יבוא
מהיכן מסמכים מגיעים למערכת
העלאה ידנית
משתמש מעלה קובץ דרך המסך הראשי (drag-drop או דפדוף). פר קובץ, מקסימום 4 במקביל.
העלאה מרובה
דף ייעודי bulk-upload.html להעלאת מאות קבצים בבת אחת עם בדיקת כפילויות.
יבוא אוטומטי
גירוד תקופתי מאתרי בתי המשפט. רץ כל 60 שניות, מוגדר ב-import_source_config.
משימות גירוד
תור גירוד ידני — אדמין מבקש גירוד חד-פעמי של תקופה / סוג. נכנס לאותו worker.
נתונים חיצוניים (CSV/XLSX)
מטא-דאטה לשיוך למסמכים קיימים (לא קבצים). לא עובר LLM, רק שיוך לפי case_number וכו'.
Direct Import API
קלט מעיבוד מקדים חיצוני: קובץ + .md + metadata.json. אם ai_analysis כבר קיים — דילוג על LLM.
2
נקודות כניסה (HTTP / רקע)
הראוטר שמקבל את הקלט
POST /documents/upload
מקבל קובץ בודד. משמש העלאה ידנית, מרובה, ויבוא אוטומטי (קורא לעצמו אחרי גירוד).
start_import_worker()
Thread רקע שעולה ב-startup. בודק import_source_config כל 60 שניות, מוריד PDFים, ואז קורא ל-upload.
POST /admin/external-datasets
מקבל CSV/XLSX. שומר את השורות בטבלאות נפרדות, לא יוצר Document חדש ולא נוגע ב-LLM.
POST /api/direct-import
אדמין-בלבד. שומר קובץ + מטא-דאטה גמורה. אם יש ai_analysis מוכן — מדלג ישר ליעד הסופי.
3
אחסון גולמי
איפה נשמר הקובץ והשורה הראשונית
תיקיית uploads/
הקובץ המקורי (PDF / DOCX / וכו') נשמר על הדיסק. שם הקובץ: {user_id}_{timestamp}_{שם_מקורי}.
קובץ סיידקאר .md
הטקסט המחולץ מהקובץ נשמר כ-Markdown ליד הקובץ המקורי. נוצר אחרי שלב 5.
טבלת documents
שורת מסמך נוצרת מיידית: filename, file_path, owner_id, content_text, metadata_json.
activity_log (upload)
רישום audit מיידי על קליטת הקובץ — מי, מתי, איזה קובץ.
שיוך נתונים חיצוניים: מסלול CSV/XLSX לא יוצר שורה ב-documents — הוא שומר ב-external_datasets + external_dataset_rows ומחבר לדוקומנטים קיימים בזמן חיפוש.
4
תור עיבוד (processing_queue)
סדרור והקצאת priority
priority 0 — ידני
העלאה ידנית מהמסך הראשי. רץ קודם.
priority 5 — יבוא אוטומטי
גירוד בתי משפט / משימות גירוד.
priority 10 — מרובה
העלאה מרובה (bulk). רץ אחרון, לא חוסם משתמשים אחרים.
סטטוס pending → running → done/failed
retry עד 3 פעמים עם exponential backoff.
5
Worker רקע (3 threads)
חילוץ טקסט ובניית הקשר ל-LLM
1. Claim שורה
תפיסת שורת pending עם FOR UPDATE SKIP LOCKED כדי להבטיח שכל thread עובד על משהו אחר.
2. חילוץ טקסט
MarkItDown ל-PDF/DOCX/PPTX/XLSX. נפילה ל-OCR (Tesseract) ל-PDF סרוק. antiword ל-.doc ישן.
3. שמירת .md סיידקאר
הטקסט שחולץ נשמר ל-content_text ולקובץ .md ליד הקובץ המקורי.
4. run_document_workflow()
מפעיל את צינור ה-LLM. עובר לשלב 6.
6
צינור מודל שפה (DeepSeek / Gemini)
סיווג, זיהוי חוקים, ולולאת trigger
א. שלב בסיס
ה-PromptRule היחיד עם trigger_tag=NULL. סיווג ראשוני, חילוץ ישויות בסיסיות, ואזכורי חוק גולמיים.
ב. זיהוי חוקים
RapidFuzz fuzzy-match בין הטקסט הגולמי של החוקים לבין law_registry. מוסיף שם רשמי + ציון התאמה.
ג. שלב מותנה
PromptRule נוסף נורה אם trigger_tag שלו מופיע בתוצאה (למשל "סוג_מסמך = פס\"ד").
ד. לולאת trigger
תוצאה של trigger אחד יכולה להפעיל trigger נוסף. עד עומק 10.
7
יעדים סופיים
איפה התוצרים נשמרים — ניתנים לחיפוש
metadata_json.ai_analysis
תוצאת ה-LLM המובנית לפי הסכמה — בתוך שורת ה-document. זמין לחיפוש פרמטרי וחיפוש NL.
detected_field
כל מפתח JSON שזוהה (גם בעומק) — מאפשר ל"מאגר שדות" לדעת אילו שדות קיימים במערכת.
law_mention
כל אזכור חוק שזוהה — מקושר ל-document_id ול-law_registry_id. בסיס לדוח "מסמכים שמזכירים חוק X".
prompt_execution
audit מלא של כל קריאת LLM — איזה prompt, איזה מודל, כמה tokens, כמה זמן, הצלחה/כישלון.
activity_log
analysis_completed או analysis_failed. גלוי בלשונית "יומן פעילות".
processing_queue (סגירה)
השורה עוברת ל-done עם finished_at, או failed עם error_detail.
טבלת מסלולים — סיכום מהיר
מקור יבוא נקודת כניסה אחסון ראשוני תור עיבוד? LLM? יעד סופי
העלאה ידנית מהמסך הראשי POST /documents/upload uploads/ + documents כן — priority 0 כן metadata_json.ai_analysis + detected_field + law_mention
העלאה מרובה (bulk-upload.html) POST /documents/upload × N uploads/ + documents כן — priority 10 כן זהה לעלאה ידנית
יבוא אוטומטי (גירוד בתי משפט) worker רקע → POST /documents/upload uploads/ + documents + import_run כן — priority 5 כן זהה + import_run / import_run_log
משימות גירוד (תור ידני) worker רקע → POST /documents/upload uploads/ + documents כן כן זהה לעלאה ידנית
יבוא נתונים חיצוניים (CSV/XLSX) POST /admin/external-datasets external_datasets + external_dataset_rows לא לא שיוך בזמן חיפוש לפי join_target_column
Direct Import API (עיבוד מקדים חיצוני) POST /api/direct-import uploads/ + documents (כולל ai_analysis) רק אם חסר ai_analysis רק אם חסר metadata_json מלא ישר מהקלט
שלבי עיבוד פנימיים
  1. קליטה: שמירת קובץ ב-uploads/, יצירת שורת documents, רישום activity_log.
  2. הכנסה לתור: processing_queue עם priority (0=ידני, 5=יבוא אוטומטי, 10=מרובה).
  3. Worker רקע: 3 threads, claim עם FOR UPDATE SKIP LOCKED.
  4. חילוץ טקסט: MarkItDown לפורמטים שונים, OCR ל-PDF סרוק, antiword ל-.doc ישן.
  5. שלב בסיס LLM: PromptRule עם trigger_tag=NULL — סיווג ראשוני.
  6. זיהוי חוקים: fuzzy match (RapidFuzz) של אזכורי חוק מול LawRegistry → law_mention.
  7. לולאת מותנים: כללי trigger_tag+value נקראים שוב ושוב עד עומק 10.
  8. גילוי שדות: כל מפתח JSON שזוהה נכנס ל-detected_field.
  9. סגירה: processing_queue עובר ל-done/failed, activity_log analysis_completed.
טבלאות מפתח שמתעדכנות
  • documents — רשומה ראשית פר מסמך (תוכן + metadata_json)
  • processing_queue — תור עיבוד (transient)
  • detected_field — שדות JSON שזוהו אוטומטית
  • law_mention — אזכורי חוק מחוברים מול LawRegistry
  • law_registry — מאגר חוקים רשמי (קבוע)
  • prompt_execution — תיעוד כל קריאת LLM (tokens, מודל, זמן)
  • activity_log — יומן פעילות מלא
  • import_source_config + import_run — הגדרות וריצות גירוד
  • external_datasets + external_dataset_rows — שיוך CSV/XLSX
יומן פעילות
תאריך ושעה סוג אירוע פרטים 📱 משתמש מסמך
השוואת מודלים
הפעלת השוואה חדשה
כל מסמך יעובד על ידי DeepSeek ו-Gemini לצורך השוואה. התוצאות לא ישנו את הניתוח הקיים.
# שם סטטוס מסמכים טוקנים DS טוקנים GM נוצר פעולות

DeepSeek - - טוקנים | - זמן ממוצע | - קריאות
Gemini - - טוקנים | - זמן ממוצע | - קריאות
מסמך DS סטטוס GM סטטוס DS טוקנים GM טוקנים DS זמן GM זמן השוואה
מסמכים אחרונים
# שם קובץ / תיק בית משפט תאריך מסמך תאריך העלאה תחום עמ'
בחר שדות להצגה
טוען שדות...

סינון
ערכים ייחודיים
טוען...
שאילתת SQL
SELECT בלבד · 15 שניות תקרת ביצוע · עמודות id/doc_id/document_id יוצגו כקישור + תתווסף עמודת document_url

                                        
שאילתות לדוגמה
סטטוס
זמן ריצה
מספר שורות
SQL שרץ
שאילתות אחרונות
אין היסטוריה עדיין — הרץ שאילתה כדי שתופיע כאן
שאילתות שמורות
אין שאילתות שמורות — שמור שאילתה מהעורך כדי שתופיע כאן
הגדרות שאילתה
מגבלה רק על תצוגת התוצאות במסך — אינה משפיעה על ייצוא CSV. טווח: 1–5,000.
מגבלת PostgreSQL statement_timeout. שאילתות אנליטיות כבדות (CTE, רגקס, JOIN על נאשמים) דורשות יותר. טווח: 5–600 שניות.
כשפעיל, לחיצה על שאילתה מהיסטוריה תריץ אותה מיד במקום רק לטעון אותה לעורך.
סוגר את כל טאבי השאילתה הפתוחים ומשאיר טאב ריק אחד.
סכמת מסד
טוען...
הגדרות מערכת
אזור זמן

כל התאריכים והשעות במערכת יוצגו לפי אזור הזמן שנבחר.

מכסת העלאות ברירת מחדל

מכסה שתוחל אוטומטית על משתמשים חדשים בעת הרשמה.
0 = ללא הגבלה  |  −1 = חסימת העלאות  |  N = מספר מסמכים מקסימלי

מנגנוני חיפוש חכם

הפעלה או כיבוי של מנגנונים שמשפרים את החיפוש החכם (NL Search).

עריכת דף אודות

התוכן שתכתוב כאן יוצג בדף האודות וכתנאי שימוש בכניסה ראשונה. שינוי התוכן מעלה את הגרסה ודורש אישור מחדש מכל המשתמשים. ניתן להשתמש ב-HTML.


עריכת הקדמה — דף "איך זה עובד?" צפה בדף

הטקסט שתכתוב כאן יוצג בראש דף ההסבר הפומבי. שאר הדף (מתודולוגיה, השוואות, דוגמאות) הוא סטטי. ניתן להשתמש ב-HTML.

עריכת סרטוני הדגמה

הגדר עד 4 סרטוני YouTube שיוצגו במודל ההדגמה. ניתן להשאיר חלקם ריקים.

טוען...
משוב מהמשתמשים
טוען...
שאילתות חיפוש חכם
יצוא חומר אימון
טוען...