Tag-It
איך זה עובד?Tag-It הוא מערכת לניהול וניתוח מסמכים משפטיים. המערכת קוראת מסמכים (PDF, Word, סריקות), מזהה את הפרטים החשובים בהם, ומאפשרת לחפש לפי כל פרט — אוטומטית.
מסמכי PDF, Word, סריקות — בכל פורמט
המערכת מזהה: צדדים, שופטים, חוקים, סעיפים, תאריכים ועוד
חיפוש פרמטרי על כל שדה שחולץ — לא רק חיפוש טקסט
כל מסמך שמועלה עובר תהליך ניתוח אוטומטי בכמה שלבים:
המסמך מומר לטקסט: PDF, Word, מצגות, Excel. מסמכים סרוקים עוברים זיהוי תווים אוטומטי. כותרות ממסמכי Word מחולצות בנפרד.
מודל שפה מנתח את הטקסט ומזהה את הפרטים המרכזיים: שם תיק, בית משפט, שופטים, תאריך, תגיות, תקציר, ואזכורי חוקים.
שמות חוקים שזוהו מושווים מול מאגר חוקים רשמי. גם אם שם החוק נכתב בצורה לא מדויקת — המערכת מזהה אותו ומתאימה לשם הרשמי.
בהתאם לסוג המסמך, מופעלים כללי ניתוח נוספים. לדוגמה: אם המסמך הוא גזר דין — המערכת תזהה גם פרטי ענישה ונאשמים.
תוצאות של שלב אחד יכולות להפעיל ניתוחים נוספים — כך המערכת חופרת יותר לעומק ומוציאה תמונה מלאה ומפורטת.
כל פרט שזוהה נרשם אוטומטית כשדה חיפוש. שדות חדשים שהמערכת מגלה הופכים מיד לזמינים לסינון — ללא הגדרה ידנית.
מערכות רבות מאפשרות חיפוש טקסט חופשי. ההבדל המהותי הוא במה שקורה לפני החיפוש:
| חיפוש רגיל | Tag-It | |
|---|---|---|
| מבנה נתונים | טקסט שטוח — בלי מבנה | מידע מאורגן בשדות: טקסט, מספרים, תאריכים, רשימות — כמו טבלה מסודרת |
| אזכורי חוקים | חיפוש מילות מפתח — לא מזהה וריאציות או שמות לא רשמיים | התאמה חכמה מול מאגר חוקים רשמי + ציון ביטחון + זיהוי סעיפים |
| חיפוש | חיפוש טקסט חופשי בלבד — "מצא מילים דומות" |
חיפוש פרמטרי: שווה, מכיל, טווח, קיים/לא קיים, התאמה חלקית
+ חיפוש שפה טבעית שמומר לסינון מדויק |
| חיפוש במערכים | לא אפשרי — אין מבנה | חיפוש מתואם: מצא נאשם ספציפי שגם הורשע וגם קיבל עונש מסוים — באותו אלמנט |
| הרחבה | קבוע — מה שיש, יש | מנהל מגדיר כללי ניתוח חדשים בכל עת. שדות חדשים מתגלים אוטומטית. |
| שקיפות | "קופסה שחורה" — לא יודעים למה הוחזרה תוצאה | כל שדה נראה, ניתן לעריכה ידנית, ניתן לחיפוש — מלא שקיפות |
מבנה נתונים שחולץ ממסמך
מה ניתן לחפש?
בזכות המבנה המובנה, ניתן לחפש בכל שדה באופן מדויק:
"מחוזי תל אביב"
"כהן"
["גזר דין", "ערעור"]
2020 ל-2024
"ישראלי"
וגם עונשו מכיל "מאסר"
— חיפוש באותו אלמנט במערך
במקום לבחור שדות ומסננים ידנית, אפשר פשוט לכתוב בעברית מה מחפשים — והמערכת עושה את השאר.
לדוגמה: "גזרי דין על סמים בירושלים מהחמור לקל"
מה קורה מאחורי הקלעים?
המערכת בודקת שהשאילתה תקינה, וטוענת את רשימת כל השדות שניתן לחפש בהם (בית משפט, שופטים, תגיות, תאריכים ועוד).
מודל שפה מקבל את המשפט שכתבתם יחד עם רשימת השדות הזמינים, ומחליט אילו מסננים להפעיל, באיזה סדר למיין, ומסביר בעברית מה הוא עשה.
המערכת בודקת שהמסננים שנוצרו הגיוניים — מתקנת שדות שלא קיימים, מתאימה אופרטורים לסוג השדה, ומנקה ערכים.
המסננים המתורגמים מופעלים כחיפוש רגיל מול מסד הנתונים — בדיוק כמו חיפוש מובנה ידני.
אם לא נמצאו תוצאות — המערכת מנסה שוב עם מסננים מרוככים. אם עדיין אין — עוברת לחיפוש טקסט חופשי כדי למצוא תוצאות קרובות.
התוצאות מוצגות עם שקיפות מלאה: הסבר מה המערכת חיפשה, שבבי מסננים שניתנים להסרה, וכפתורים להרחבה או צמצום החיפוש.