Tag-It: איך זה עובד? — מערכת ניהול מסמכים

Tag-It הוא מערכת לניהול וניתוח מסמכים משפטיים. המערכת קוראת מסמכים (PDF, Word, סריקות), מזהה את הפרטים החשובים בהם, ומאפשרת לחפש לפי כל פרט — אוטומטית.

העלאה

מסמכי PDF, Word, סריקות — בכל פורמט

ניתוח אוטומטי

המערכת מזהה: צדדים, שופטים, חוקים, סעיפים, תאריכים ועוד

חיפוש מדויק

חיפוש פרמטרי על כל שדה שחולץ — לא רק חיפוש טקסט

כל פרט שהמערכת מזהה הופך לשדה חיפוש — ניתן לסנן לפי בית משפט, שופט, חוק, סעיף, סוג מסמך, ועוד עשרות שדות שמתגלים אוטומטית. הנתונים נשמרים בטבלאות יחסיות ייעודיות (שופטים, נאשמים, אזכורי חוקים ועוד), מה שמאפשר חיפוש מובנה מהיר ומדויק — לא רק חיפוש טקסט.

כל מסמך שמועלה עובר תהליך ניתוח אוטומטי בכמה שלבים:

1 המרה לטקסט

המסמך מומר לטקסט: PDF, Word, מצגות, Excel. מסמכים סרוקים עוברים זיהוי תווים אוטומטי. כותרות ממסמכי Word מחולצות בנפרד.

2 סיווג בסיס

מודל שפה מנתח את הטקסט ומזהה את הפרטים המרכזיים: שם תיק, בית משפט, שופטים, תאריך, תגיות, תקציר, ואזכורי חוקים.

3 זיהוי חוקים

שמות חוקים שזוהו מושווים מול מאגר חוקים רשמי. גם אם שם החוק נכתב בצורה לא מדויקת — המערכת מזהה אותו ומתאימה לשם הרשמי.

4 ניתוח מותאם

בהתאם לסוג המסמך, מופעלים כללי ניתוח נוספים. לדוגמה: אם המסמך הוא גזר דין — המערכת תזהה גם פרטי ענישה ונאשמים.

5 ניתוח מעמיק

תוצאות של שלב אחד יכולות להפעיל ניתוחים נוספים — כך המערכת חופרת יותר לעומק ומוציאה תמונה מלאה ומפורטת.

6 גילוי שדות אוטומטי

כל פרט שזוהה נרשם אוטומטית כשדה חיפוש. שדות חדשים שהמערכת מגלה הופכים מיד לזמינים לסינון — ללא הגדרה ידנית.

7 סיווג אוטומטי לתחומים

לאחר הניתוח, המערכת בודקת את התגיות שזוהו ומשייכת את המסמך אוטומטית לתחום המתאים — למשל: גזר דין פלילי, חופש מידע, לשון הרע, ערעור פלילי ועוד. כך מסמכים שמיובאים ממקורות חיצוניים מנותבים אוטומטית למקום הנכון.

מנהל המערכת מגדיר את כללי הניתוח — אילו פרטים לחלץ מכל סוג מסמך, ובאיזה מודל שפה להשתמש.

מערכות רבות מאפשרות חיפוש טקסט חופשי. ההבדל המהותי הוא במה שקורה לפני החיפוש:

	חיפוש רגיל	Tag-It
מבנה נתונים	טקסט שטוח — בלי מבנה	מידע מאורגן בשדות: טקסט, מספרים, תאריכים, רשימות — כמו טבלה מסודרת
אזכורי חוקים	חיפוש מילות מפתח — לא מזהה וריאציות או שמות לא רשמיים	התאמה חכמה מול מאגר חוקים רשמי + ציון ביטחון + זיהוי סעיפים
חיפוש	חיפוש טקסט חופשי בלבד — "מצא מילים דומות"	חיפוש פרמטרי: שווה, מכיל, טווח, קיים/לא קיים, התאמה חלקית + חיפוש שפה טבעית שמומר לסינון מדויק
חיפוש במערכים	לא אפשרי — אין מבנה	חיפוש מתואם: מצא נאשם ספציפי שגם הורשע וגם קיבל עונש מסוים — באותו אלמנט
הרחבה	קבוע — מה שיש, יש	מנהל מגדיר כללי ניתוח חדשים בכל עת. שדות חדשים מתגלים אוטומטית.
שקיפות	"קופסה שחורה" — לא יודעים למה הוחזרה תוצאה	כל שדה נראה, ניתן לעריכה ידנית, ניתן לחיפוש — מלא שקיפות

מבנה נתונים שחולץ ממסמך

גזר דין — תיק פל"א 1234-02-24

שם התיק

מדינת ישראל נ' ישראל ישראלי

בית משפט

בית משפט מחוזי תל אביב-יפו

תאריך

15.01.2024

שופטים

כב' השופט כהן כב' השופטת לוי

תגיות

גזר דין פלילי סמים

תקציר

הנאשם הורשע בעבירות סמים לפי פקודת הסמים המסוכנים. נגזרו 3 שנות מאסר.

אזכורי חוקים (זוהו אוטומטית)

פקודת הסמים המסוכנים [נוסח חדש], תשל"ג-1973 סעיף 7

ביטחון: 96%

"...עבירה לפי סעיף 7 לפקודת הסמים המסוכנים..."

חוק העונשין, תשל"ז-1977 סעיף 300

ביטחון: 92%

"...לפי סעיף 300 לחוק העונשין..."

ניתוח מורחב — נאשמים (חולץ ע"י כלל מופעל)

ישראל ישראלי הורשע

עבירה: החזקת סמים שלא לצריכה עצמית • עונש: 3 שנות מאסר בפועל • סעיף: 7 לפקודת הסמים

מה ניתן לחפש?

בזכות המבנה המובנה, ניתן לחפש בכל שדה באופן מדויק:

שווה בית_משפט = "מחוזי תל אביב"

47 תוצאות

מכיל שופטים מכיל "כהן"

23 תוצאות

אחד מ תגיות אחד מ: ["גזר דין", "ערעור"]

156 תוצאות

טווח שנת_פסיקה בין 2020 ל-2024

312 תוצאות

מתואם נאשם ששמו "ישראלי" וגם עונשו מכיל "מאסר"
— חיפוש באותו רשומה בטבלה היחסית, לא סתם טקסט חופשי

8 תוצאות

חיפוש בשפה טבעית: ניתן גם פשוט לכתוב בעברית "מצא גזרי דין מבית משפט מחוזי שמכילים עונש מאסר" — והמערכת תמיר את הבקשה לסינון מדויק אוטומטית.

במערכת שני מצבי חיפוש: חיפוש חכם — כתיבה חופשית בעברית שהמערכת ממירה לסינון מדויק, וחיפוש פשוט — התאמת טקסט ישירה על שדות ליבה (שם תיק, תקציר, בית משפט, מספר תיק).

בחיפוש חכם, במקום לבחור שדות ומסננים ידנית, אפשר פשוט לכתוב בעברית מה מחפשים — והמערכת עושה את השאר.
לדוגמה: "גזרי דין על סמים בירושלים מהחמור לקל"

מה קורה מאחורי הקלעים?

1 הבנת השאילתה

המערכת בודקת שהשאילתה תקינה, וטוענת את רשימת כל השדות שניתן לחפש בהם (בית משפט, שופטים, תגיות, תאריכים ועוד).

2 תרגום לחיפוש מובנה

מודל שפה מקבל את המשפט שכתבתם יחד עם רשימת השדות הזמינים, ומחליט אילו מסננים להפעיל, באיזה סדר למיין, ומסביר בעברית מה הוא עשה.

3 בדיקת תקינות

המערכת בודקת שהמסננים שנוצרו הגיוניים — מתקנת שדות שלא קיימים, מתאימה אופרטורים לסוג השדה, ומנקה ערכים.

4 ביצוע החיפוש

המסננים המתורגמים מופעלים כחיפוש רגיל מול מסד הנתונים — בדיוק כמו חיפוש מובנה ידני.

5 תיקון אוטומטי

אם לא נמצאו תוצאות — המערכת מנסה שוב עם מסננים מרוככים. אם עדיין אין — עוברת לחיפוש טקסט חופשי כדי למצוא תוצאות קרובות.

6 הצגת התוצאות

התוצאות מוצגות עם שקיפות מלאה: הסבר מה המערכת חיפשה, שבבי מסננים שניתנים להסרה, וכפתורים להרחבה או צמצום החיפוש.

דוגמאות לשאילתות

שפה טבעית "גזרי דין על סמים בירושלים"

תגיות + בית משפט

שפה טבעית "פסקי דין של השופט כהן מ-2024"

שופטים + תאריך + מיון

שפה טבעית "תיקים עם ביטול הרשעה מהחמור לקל"

ביטול הרשעה + מיון חומרה

לא מרוצים מהתוצאות? אפשר ללחוץ "הרחב חיפוש" כדי לקבל יותר תוצאות (עם מילים נרדפות וחיפוש גמיש יותר), או "צמצם חיפוש" כדי לקבל רק תוצאות שמתאימות בדיוק.

חיפוש פשוט — לא צריך מודל שפה. פשוט מקלידים טקסט והמערכת מחפשת התאמה ישירה בשדות הליבה: שם תיק, תקציר, בית משפט ומספר תיק. מתאים כשיודעים בדיוק מה מחפשים.

Tag-It

מה זה Tag-It?

צינור הניתוח — איך המערכת מעבדת מסמך?

מה ההבדל ממערכות חיפוש רגילות?

דוגמאות — איך הנתונים נראים?

מבנה נתונים שחולץ ממסמך

מה ניתן לחפש?

חיפוש חכם — איך זה עובד?

מה קורה מאחורי הקלעים?

דוגמאות לשאילתות