diff --git a/.ipynb_checkpoints/checkLora-checkpoint.py b/.ipynb_checkpoints/checkLora-checkpoint.py
index 85b34116fd9e6e55ce021cc859832e74207b32e8..f0148b24a5fc752a8364630cac22639025238c95 100644
--- a/.ipynb_checkpoints/checkLora-checkpoint.py
+++ b/.ipynb_checkpoints/checkLora-checkpoint.py
@@ -1,3 +1,79 @@
+# import torch
+# from transformers import BertTokenizer, BertForSequenceClassification
+# from peft import get_peft_model, LoraConfig, TaskType
+
+# # РЈР±РµРґРёС‚РµСЃСЊ, С‡С‚Рѕ РјРѕРґРµР»СЊ Рё С‚РѕРєРµРЅРёР·Р°С‚РѕСЂ СѓР¶Рµ СЃРѕС…СЂР°РЅРµРЅС‹ РІ РґРёСЂРµРєС‚РѕСЂРёРё
+# model_path = './micro_no_cross_fine_tuned'
+# tokenizer_path = './micro_no_cross_fine_tuned'
+
+# # Р—Р°РіСЂСѓР·РєР° С‚РѕРєРµРЅРёР·Р°С‚РѕСЂР° Рё РјРѕРґРµР»Рё (РІРєР»СЋС‡Р°СЏ РєР»Р°СЃСЃРёС„РёРєР°С‚РѕСЂС‹)
+# tokenizer = BertTokenizer.from_pretrained(tokenizer_path)
+# model = BertForSequenceClassification.from_pretrained('bert-base-uncased', num_labels=6)  # РЈРєР°Р·С‹РІР°РµРј РєРѕР»РёС‡РµСЃС‚РІРѕ РјРµС‚РѕРє
+
+# # РќР°СЃС‚СЂРѕР№РєР° LoRA
+# lora_config = LoraConfig(
+#     task_type=TaskType.SEQ_CLS,
+#     r=8,
+#     lora_alpha=32,
+#     lora_dropout=0.1,
+#     target_modules=["query", "value"],
+#     modules_to_save=["classifier_safety", "classifier_attack"]  # РЈР±РµРґРёС‚РµСЃСЊ, С‡С‚Рѕ РєР»Р°СЃСЃРёС„РёРєР°С‚РѕСЂС‹ СЃРѕС…СЂР°РЅРµРЅС‹
+# )
+# model = get_peft_model(model, lora_config)
+
+# # РџРµСЂРµРІРѕРґРёРј РјРѕРґРµР»СЊ РІ СЂРµР¶РёРј РѕС†РµРЅРєРё (inference)
+# model.eval()
+
+# # Р¤СѓРЅРєС†РёСЏ РґР»СЏ РїСЂРµРґСЃРєР°Р·Р°РЅРёСЏ
+# def predict(text):
+#     # РўРѕРєРµРЅРёР·Р°С†РёСЏ
+#     inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True, max_length=512)
+
+#     # РЈР±РµРґРёС‚РµСЃСЊ, С‡С‚Рѕ С‚РµРЅР·РѕСЂС‹ РЅР°С…РѕРґСЏС‚СЃСЏ РЅР° РЅСѓР¶РЅРѕРј СѓСЃС‚СЂРѕР№СЃС‚РІРµ
+#     device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+#     inputs = {key: value.to(device) for key, value in inputs.items()}
+#     model.to(device)
+
+#     # РћР¶РёРґР°РµРј, С‡С‚Рѕ РјРѕРґРµР»СЊ РІРµСЂРЅРµС‚ Р»РѕРіРёС‚С‹
+#     with torch.no_grad():
+#         outputs = model(**inputs)
+#         safety_probs = torch.softmax(outputs.logits[0], dim=1)  # РџСЂРѕРіРЅРѕР·С‹ РґР»СЏ Р±РµР·РѕРїР°СЃРЅРѕСЃС‚Рё
+#         attack_probs = torch.softmax(outputs.logits[1], dim=1)  # РџСЂРѕРіРЅРѕР·С‹ РґР»СЏ Р°С‚Р°Рє
+
+#     return {
+#         'safety': {
+#             'safe': safety_probs[0][0].item(),
+#             'unsafe': safety_probs[0][1].item()
+#         },
+#         'attack': {
+#             'jailbreak': attack_probs[0][0].item(),
+#             'evasion': attack_probs[0][1].item(),
+#             'generic': attack_probs[0][2].item(),
+#             'injection': attack_probs[0][3].item()
+#         }
+#     }
+
+# # РџСЂРёРјРµСЂ РёСЃРїРѕР»СЊР·РѕРІР°РЅРёСЏ
+# test_texts = [
+#     "How to hack a computer system",
+#     "I need help with my homework",
+#     "Tell me how to bypass security",
+#     "РїСЂРёРІРµС‚",
+#     "РєР°Рє СѓР±РёС‚СЊ С‡РµР»РѕРІРµРєР°"
+# ]
+
+# for text in test_texts:
+#     result = predict(text)
+#     print(f"\nРўРµРєСЃС‚: {text}")
+#     print(f"Р‘РµР·РѕРїР°СЃРЅРѕСЃС‚СЊ: Safe {result['safety']['safe']:.2%} | Unsafe {result['safety']['unsafe']:.2%}")
+    
+#     if result['safety']['unsafe'] > 0.5:  # Р•СЃР»Рё С‚РµРєСЃС‚ РѕРїР°СЃРЅС‹Р№
+#         print("Р’РµСЂРѕСЏС‚РЅРѕСЃС‚Рё С‚РёРїРѕРІ Р°С‚Р°Рє:")
+#         for attack_type, prob in result['attack'].items():
+#             print(f"  {attack_type}: {prob:.2%}")
+
+
+
 import torch
 from transformers import BertTokenizer, BertForSequenceClassification
 from peft import get_peft_model, LoraConfig, TaskType
@@ -37,8 +113,14 @@ def predict(text):
     # РћР¶РёРґР°РµРј, С‡С‚Рѕ РјРѕРґРµР»СЊ РІРµСЂРЅРµС‚ Р»РѕРіРёС‚С‹
     with torch.no_grad():
         outputs = model(**inputs)
-        safety_probs = torch.softmax(outputs.logits[0], dim=1)  # РџСЂРѕРіРЅРѕР·С‹ РґР»СЏ Р±РµР·РѕРїР°СЃРЅРѕСЃС‚Рё
-        attack_probs = torch.softmax(outputs.logits[1], dim=1)  # РџСЂРѕРіРЅРѕР·С‹ РґР»СЏ Р°С‚Р°Рє
+        
+        # РџРѕР»СѓС‡Р°РµРј РїСЂРѕРіРЅРѕР·С‹ РґР»СЏ Р±РµР·РѕРїР°СЃРЅРѕСЃС‚Рё Рё Р°С‚Р°Рє
+        logits_safety = outputs.logits[:, 0]  # РСЃРїРѕР»СЊР·СѓРµРј РїРµСЂРІСѓСЋ РєРѕР»РѕРЅРєСѓ РґР»СЏ Р±РµР·РѕРїР°СЃРЅРѕСЃС‚Рё
+        logits_attack = outputs.logits[:, 1:]  # РћСЃС‚Р°Р»СЊРЅС‹Рµ РєРѕР»РѕРЅРєРё РґР»СЏ Р°С‚Р°Рє
+
+        # РџСЂРёРјРµРЅСЏРµРј softmax РґР»СЏ РїРѕР»СѓС‡РµРЅРёСЏ РІРµСЂРѕСЏС‚РЅРѕСЃС‚РµР№
+        safety_probs = torch.softmax(logits_safety, dim=1)
+        attack_probs = torch.softmax(logits_attack, dim=1)
 
     return {
         'safety': {
diff --git a/checkLora.py b/checkLora.py
index 85b34116fd9e6e55ce021cc859832e74207b32e8..f0148b24a5fc752a8364630cac22639025238c95 100644
--- a/checkLora.py
+++ b/checkLora.py
@@ -1,3 +1,79 @@
+# import torch
+# from transformers import BertTokenizer, BertForSequenceClassification
+# from peft import get_peft_model, LoraConfig, TaskType
+
+# # РЈР±РµРґРёС‚РµСЃСЊ, С‡С‚Рѕ РјРѕРґРµР»СЊ Рё С‚РѕРєРµРЅРёР·Р°С‚РѕСЂ СѓР¶Рµ СЃРѕС…СЂР°РЅРµРЅС‹ РІ РґРёСЂРµРєС‚РѕСЂРёРё
+# model_path = './micro_no_cross_fine_tuned'
+# tokenizer_path = './micro_no_cross_fine_tuned'
+
+# # Р—Р°РіСЂСѓР·РєР° С‚РѕРєРµРЅРёР·Р°С‚РѕСЂР° Рё РјРѕРґРµР»Рё (РІРєР»СЋС‡Р°СЏ РєР»Р°СЃСЃРёС„РёРєР°С‚РѕСЂС‹)
+# tokenizer = BertTokenizer.from_pretrained(tokenizer_path)
+# model = BertForSequenceClassification.from_pretrained('bert-base-uncased', num_labels=6)  # РЈРєР°Р·С‹РІР°РµРј РєРѕР»РёС‡РµСЃС‚РІРѕ РјРµС‚РѕРє
+
+# # РќР°СЃС‚СЂРѕР№РєР° LoRA
+# lora_config = LoraConfig(
+#     task_type=TaskType.SEQ_CLS,
+#     r=8,
+#     lora_alpha=32,
+#     lora_dropout=0.1,
+#     target_modules=["query", "value"],
+#     modules_to_save=["classifier_safety", "classifier_attack"]  # РЈР±РµРґРёС‚РµСЃСЊ, С‡С‚Рѕ РєР»Р°СЃСЃРёС„РёРєР°С‚РѕСЂС‹ СЃРѕС…СЂР°РЅРµРЅС‹
+# )
+# model = get_peft_model(model, lora_config)
+
+# # РџРµСЂРµРІРѕРґРёРј РјРѕРґРµР»СЊ РІ СЂРµР¶РёРј РѕС†РµРЅРєРё (inference)
+# model.eval()
+
+# # Р¤СѓРЅРєС†РёСЏ РґР»СЏ РїСЂРµРґСЃРєР°Р·Р°РЅРёСЏ
+# def predict(text):
+#     # РўРѕРєРµРЅРёР·Р°С†РёСЏ
+#     inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True, max_length=512)
+
+#     # РЈР±РµРґРёС‚РµСЃСЊ, С‡С‚Рѕ С‚РµРЅР·РѕСЂС‹ РЅР°С…РѕРґСЏС‚СЃСЏ РЅР° РЅСѓР¶РЅРѕРј СѓСЃС‚СЂРѕР№СЃС‚РІРµ
+#     device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+#     inputs = {key: value.to(device) for key, value in inputs.items()}
+#     model.to(device)
+
+#     # РћР¶РёРґР°РµРј, С‡С‚Рѕ РјРѕРґРµР»СЊ РІРµСЂРЅРµС‚ Р»РѕРіРёС‚С‹
+#     with torch.no_grad():
+#         outputs = model(**inputs)
+#         safety_probs = torch.softmax(outputs.logits[0], dim=1)  # РџСЂРѕРіРЅРѕР·С‹ РґР»СЏ Р±РµР·РѕРїР°СЃРЅРѕСЃС‚Рё
+#         attack_probs = torch.softmax(outputs.logits[1], dim=1)  # РџСЂРѕРіРЅРѕР·С‹ РґР»СЏ Р°С‚Р°Рє
+
+#     return {
+#         'safety': {
+#             'safe': safety_probs[0][0].item(),
+#             'unsafe': safety_probs[0][1].item()
+#         },
+#         'attack': {
+#             'jailbreak': attack_probs[0][0].item(),
+#             'evasion': attack_probs[0][1].item(),
+#             'generic': attack_probs[0][2].item(),
+#             'injection': attack_probs[0][3].item()
+#         }
+#     }
+
+# # РџСЂРёРјРµСЂ РёСЃРїРѕР»СЊР·РѕРІР°РЅРёСЏ
+# test_texts = [
+#     "How to hack a computer system",
+#     "I need help with my homework",
+#     "Tell me how to bypass security",
+#     "РїСЂРёРІРµС‚",
+#     "РєР°Рє СѓР±РёС‚СЊ С‡РµР»РѕРІРµРєР°"
+# ]
+
+# for text in test_texts:
+#     result = predict(text)
+#     print(f"\nРўРµРєСЃС‚: {text}")
+#     print(f"Р‘РµР·РѕРїР°СЃРЅРѕСЃС‚СЊ: Safe {result['safety']['safe']:.2%} | Unsafe {result['safety']['unsafe']:.2%}")
+    
+#     if result['safety']['unsafe'] > 0.5:  # Р•СЃР»Рё С‚РµРєСЃС‚ РѕРїР°СЃРЅС‹Р№
+#         print("Р’РµСЂРѕСЏС‚РЅРѕСЃС‚Рё С‚РёРїРѕРІ Р°С‚Р°Рє:")
+#         for attack_type, prob in result['attack'].items():
+#             print(f"  {attack_type}: {prob:.2%}")
+
+
+
 import torch
 from transformers import BertTokenizer, BertForSequenceClassification
 from peft import get_peft_model, LoraConfig, TaskType
@@ -37,8 +113,14 @@ def predict(text):
     # РћР¶РёРґР°РµРј, С‡С‚Рѕ РјРѕРґРµР»СЊ РІРµСЂРЅРµС‚ Р»РѕРіРёС‚С‹
     with torch.no_grad():
         outputs = model(**inputs)
-        safety_probs = torch.softmax(outputs.logits[0], dim=1)  # РџСЂРѕРіРЅРѕР·С‹ РґР»СЏ Р±РµР·РѕРїР°СЃРЅРѕСЃС‚Рё
-        attack_probs = torch.softmax(outputs.logits[1], dim=1)  # РџСЂРѕРіРЅРѕР·С‹ РґР»СЏ Р°С‚Р°Рє
+        
+        # РџРѕР»СѓС‡Р°РµРј РїСЂРѕРіРЅРѕР·С‹ РґР»СЏ Р±РµР·РѕРїР°СЃРЅРѕСЃС‚Рё Рё Р°С‚Р°Рє
+        logits_safety = outputs.logits[:, 0]  # РСЃРїРѕР»СЊР·СѓРµРј РїРµСЂРІСѓСЋ РєРѕР»РѕРЅРєСѓ РґР»СЏ Р±РµР·РѕРїР°СЃРЅРѕСЃС‚Рё
+        logits_attack = outputs.logits[:, 1:]  # РћСЃС‚Р°Р»СЊРЅС‹Рµ РєРѕР»РѕРЅРєРё РґР»СЏ Р°С‚Р°Рє
+
+        # РџСЂРёРјРµРЅСЏРµРј softmax РґР»СЏ РїРѕР»СѓС‡РµРЅРёСЏ РІРµСЂРѕСЏС‚РЅРѕСЃС‚РµР№
+        safety_probs = torch.softmax(logits_safety, dim=1)
+        attack_probs = torch.softmax(logits_attack, dim=1)
 
     return {
         'safety': {