diff --git a/.ipynb_checkpoints/GOYDAobuch-checkpoint.py b/.ipynb_checkpoints/GOYDAobuch-checkpoint.py
new file mode 100644
index 0000000000000000000000000000000000000000..4ba976cce673906b240e6cce909b372fbd1890ff
--- /dev/null
+++ b/.ipynb_checkpoints/GOYDAobuch-checkpoint.py
@@ -0,0 +1,246 @@
+import os
+import pandas as pd
+import torch
+import numpy as np
+import matplotlib.pyplot as plt
+from sklearn.model_selection import train_test_split
+from sklearn.metrics import f1_score, precision_score, recall_score
+from sklearn.utils.class_weight import compute_class_weight
+from datasets import Dataset, load_from_disk
+from transformers import BertTokenizer, BertPreTrainedModel, BertModel, Trainer, TrainingArguments
+from torch import nn
+from peft import get_peft_model, LoraConfig, TaskType
+
+# РћС‡РёСЃС‚РєР° РєРµС€Р°
+torch.cuda.empty_cache()
+
+# РћРїСЂРµРґРµР»СЏРµРј СѓСЃС‚СЂРѕР№СЃС‚РІРѕ (GPU РёР»Рё CPU)
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+
+# РџСѓС‚Рё РґР»СЏ СЃРѕС…СЂР°РЅРµРЅРёСЏ С‚РѕРєРµРЅРёР·РёСЂРѕРІР°РЅРЅС‹С… РґР°РЅРЅС‹С…
+TOKENIZED_DATA_DIR = "./tokenized_data_goyda"
+TRAIN_TOKENIZED_PATH = os.path.join(TOKENIZED_DATA_DIR, "train")
+VAL_TOKENIZED_PATH = os.path.join(TOKENIZED_DATA_DIR, "val")
+TEST_TOKENIZED_PATH = os.path.join(TOKENIZED_DATA_DIR, "test")
+
+# Р—Р°РіСЂСѓР·РєР° РґР°РЅРЅС‹С…
+data = pd.read_csv('all_dataset.csv')
+# data = data.sample(frac=0.05, random_state=42).copy()  # Р‘РµСЂРµРј 10% СЃР»СѓС‡Р°Р№РЅС‹С… РґР°РЅРЅС‹С…
+
+
+
+# Р Р°Р·РґРµР»РµРЅРёРµ РґР°РЅРЅС‹С… РЅР° train, validation Рё test
+train_data, test_data = train_test_split(data, test_size=0.2, random_state=42)
+train_data, val_data = train_test_split(train_data, test_size=0.1, random_state=42)
+
+# РџСЂРµРѕР±СЂР°Р·РѕРІР°РЅРёРµ РґР°РЅРЅС‹С… РІ Dataset
+train_dataset = Dataset.from_pandas(train_data)
+val_dataset = Dataset.from_pandas(val_data)
+test_dataset = Dataset.from_pandas(test_data)
+
+# Р—Р°РіСЂСѓР·РєР° С‚РѕРєРµРЅРёР·Р°С‚РѕСЂР°
+tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
+
+# Р¤СѓРЅРєС†РёСЏ С‚РѕРєРµРЅРёР·Р°С†РёРё
+def preprocess_function(examples):
+    tokenized = tokenizer(examples['prompt'], truncation=True, padding=True, max_length=512)
+
+    labels_safety = [0 if label == "safe" else 1 for label in examples['safety']]
+    labels_attack = [0 if label == "jailbreak" else 1 if label == "evasion" else 2 if label == "generic attack" else 3 for label in examples['type']]
+
+    tokenized['labels'] = list(zip(labels_safety, labels_attack))
+    return tokenized
+
+# РўРѕРєРµРЅРёР·Р°С†РёСЏ РґР°РЅРЅС‹С… (РµСЃР»Рё РЅРµ СЃРѕС…СЂР°РЅРµРЅС‹, С‚Рѕ СЃРѕР·РґР°РµРј)
+if os.path.exists(TRAIN_TOKENIZED_PATH) and os.path.exists(VAL_TOKENIZED_PATH) and os.path.exists(TEST_TOKENIZED_PATH):
+    train_dataset = load_from_disk(TRAIN_TOKENIZED_PATH)
+    val_dataset = load_from_disk(VAL_TOKENIZED_PATH)
+    test_dataset = load_from_disk(TEST_TOKENIZED_PATH)
+else:
+    train_dataset = train_dataset.map(preprocess_function, batched=True)
+    val_dataset = val_dataset.map(preprocess_function, batched=True)
+    test_dataset = test_dataset.map(preprocess_function, batched=True)
+
+    os.makedirs(TOKENIZED_DATA_DIR, exist_ok=True)
+    train_dataset.save_to_disk(TRAIN_TOKENIZED_PATH)
+    val_dataset.save_to_disk(VAL_TOKENIZED_PATH)
+    test_dataset.save_to_disk(TEST_TOKENIZED_PATH)
+
+# Р’С‹С‡РёСЃР»РµРЅРёРµ РІРµСЃРѕРІ РєР»Р°СЃСЃРѕРІ
+class_weights_task1 = compute_class_weight('balanced', classes=np.unique(train_data['safety']), y=train_data['safety'])
+class_weights_task2 = compute_class_weight('balanced', classes=np.unique(train_data[train_data['safety'] == 'unsafe']['type']),
+                                            y=train_data[train_data['safety'] == 'unsafe']['type'])
+
+# РџРµСЂРµРІРѕРґ РІРµСЃРѕРІ РІ С‚РµРЅР·РѕСЂС‹
+class_weights_task1_tensor = torch.tensor(class_weights_task1, dtype=torch.float32).to(device)
+class_weights_task2_tensor = torch.tensor(class_weights_task2, dtype=torch.float32).to(device)
+
+# РћРїСЂРµРґРµР»РµРЅРёРµ РјРѕРґРµР»Рё
+class MultiTaskBert(BertPreTrainedModel):
+    def __init__(self, config):
+        super().__init__(config)
+        self.bert = BertModel(config)
+        self.classifier_safety = nn.Linear(config.hidden_size, 2)
+        self.classifier_attack = nn.Linear(config.hidden_size, 4)
+
+    def forward(self, input_ids=None, attention_mask=None, labels=None, **kwargs):
+        # РџРµСЂРµРІРѕРґРёРј С‚РµРЅР·РѕСЂС‹ РЅР° СѓСЃС‚СЂРѕР№СЃС‚РІРѕ
+        input_ids, attention_mask, labels = map(lambda x: x.to(device) if x is not None else None, [input_ids, attention_mask, labels])
+        outputs = self.bert(input_ids=input_ids, attention_mask=attention_mask, return_dict=True)
+        pooled_output = outputs.last_hidden_state[:, 0, :]
+
+        logits_safety = self.classifier_safety(pooled_output)
+        logits_attack = self.classifier_attack(pooled_output)
+
+        loss = None
+        if labels is not None:
+            labels_safety, labels_attack = labels[:, 0], labels[:, 1]
+            loss_safety = nn.CrossEntropyLoss(weight=class_weights_task1_tensor)(logits_safety, labels_safety)
+            loss_attack = nn.CrossEntropyLoss(weight=class_weights_task2_tensor)(logits_attack, labels_attack)
+            loss = loss_safety + loss_attack
+
+        return {'logits_safety': logits_safety, 'logits_attack': logits_attack, 'loss': loss}
+
+# РЎРѕР·РґР°РЅРёРµ РјРѕРґРµР»Рё
+base_model = MultiTaskBert.from_pretrained('bert-base-uncased').to(device)
+base_model.save_pretrained('./model_fine_tuned_goyda')  # РЎРѕС…СЂР°РЅСЏРµС‚ РјРѕРґРµР»СЊ Рё РµС‘ РІРµСЃР°
+
+# РќР°СЃС‚СЂРѕР№РєР° LoRA.
+# РЇРІРЅРѕ РёСЃРєР»СЋС‡Р°РµРј СЃРѕС…СЂР°РЅРµРЅРёРµ РјРѕРґСѓР»РµР№, РЅРµ Р°РґР°РїС‚РёСЂРѕРІР°РЅРЅС‹С… LoRA (РЅР°РїСЂРёРјРµСЂ, РєР»Р°СЃСЃРёС„РёРєР°С‚РѕСЂРѕРІ),
+# С‡С‚РѕР±С‹ РЅРµ РІРѕР·РЅРёРєР°Р»Рѕ KeyError РїСЂРё Р·Р°РіСЂСѓР·РєРµ.
+lora_config = LoraConfig(
+    task_type=TaskType.SEQ_CLS,
+    r=8,
+    lora_alpha=32,
+    lora_dropout=0.1,
+    target_modules=["query", "value"],
+    # modules_to_save=["classifier"]  # РќРµ СЃРѕС…СЂР°РЅСЏРµРј РґРѕРїРѕР»РЅРёС‚РµР»СЊРЅС‹Рµ РјРѕРґСѓР»Рё (classifier Рё С‚.Рґ.)
+    modules_to_save=["classifier_safety", "classifier_attack"]  # РЇРІРЅРѕ СѓРєР°Р·С‹РІР°РµРј РѕР±Р° РєР»Р°СЃСЃРёС„РёРєР°С‚РѕСЂР°
+)
+
+model = get_peft_model(base_model, lora_config)
+
+# Р¤СѓРЅРєС†РёСЏ РІС‹С‡РёСЃР»РµРЅРёСЏ РјРµС‚СЂРёРє
+def compute_metrics(p):
+    preds_safety = np.argmax(p.predictions[0], axis=1)
+    preds_attack = np.argmax(p.predictions[1], axis=1)
+    labels_safety, labels_attack = p.label_ids[:, 0], p.label_ids[:, 1]
+
+    return {
+        'f1_safety': f1_score(labels_safety, preds_safety, average='weighted'),
+        'precision_safety': precision_score(labels_safety, preds_safety, average='weighted'),
+        'recall_safety': recall_score(labels_safety, preds_safety, average='weighted'),
+        'f1_attack': f1_score(labels_attack, preds_attack, average='weighted'),
+        'precision_attack': precision_score(labels_attack, preds_attack, average='weighted'),
+        'recall_attack': recall_score(labels_attack, preds_attack, average='weighted'),
+    }
+
+# РђСЂРіСѓРјРµРЅС‚С‹ РѕР±СѓС‡РµРЅРёСЏ
+training_args = TrainingArguments(
+    output_dir='./results',
+    evaluation_strategy="epoch",
+    save_strategy="epoch",
+    learning_rate=3e-5,
+    per_device_train_batch_size=16,
+    per_device_eval_batch_size=16,
+    num_train_epochs=3,
+    weight_decay=0.01,
+    logging_dir='./logs',
+    logging_steps=10,
+    save_total_limit=2,
+    load_best_model_at_end=True,
+    metric_for_best_model="f1_safety",
+    greater_is_better=True,
+    fp16=True,
+    max_grad_norm=1.0,
+    warmup_steps=100,
+    report_to="none",
+)
+
+# РћР±СѓС‡РµРЅРёРµ
+trainer = Trainer(model=model, args=training_args, train_dataset=train_dataset, eval_dataset=val_dataset, compute_metrics=compute_metrics)
+
+trainer.train()
+
+# РћС†РµРЅРєР°
+val_results = trainer.evaluate(val_dataset)
+test_results = trainer.evaluate(test_dataset)
+
+print("Validation Results:", val_results)
+print("Test Results:", test_results)
+
+# Р“СЂР°С„РёРє РїРѕС‚РµСЂСЊ
+logs = trainer.state.log_history
+train_loss = [log["loss"] for log in logs if "loss" in log]
+val_loss = [log["eval_loss"] for log in logs if "eval_loss" in log]
+
+plt.plot(train_loss, label="Train Loss")
+plt.plot(val_loss, label="Validation Loss")
+plt.legend()
+plt.show()
+
+# # РЎРѕС…СЂР°РЅРµРЅРёРµ РјРѕРґРµР»Рё РІРјРµСЃС‚Рµ СЃ Р°РґР°РїС‚РµСЂР°РјРё LoRA
+# trainer.save_model('./fine-tuned-bert-lora_new')
+# tokenizer.save_pretrained('./fine-tuned-bert-lora_new')
+# РЎРѕС…СЂР°РЅРµРЅРёРµ РјРѕРґРµР»Рё, Р°РґР°РїС‚РµСЂРѕРІ LoRA Рё С‚РѕРєРµРЅРёР·Р°С‚РѕСЂР°
+# base_model.save_pretrained('./micro_no_cross_fine_tuned/base')  # РЎРѕС…СЂР°РЅСЏРµС‚ РјРѕРґРµР»СЊ Рё РµС‘ РІРµСЃР°
+tokenizer.save_pretrained('./model_fine_tuned_goyda')  # РЎРѕС…СЂР°РЅСЏРµС‚ С‚РѕРєРµРЅРёР·Р°С‚РѕСЂ
+# model.save_pretrained("./micro_no_cross_fine_tuned")
+model.save_pretrained("./model_fine_tuned_goyda/lora")
+# model.save_adapter('./micro_no_cross_fine_tuned')  # РЎРѕС…СЂР°РЅСЏРµС‚ Р°РґР°РїС‚РµСЂС‹ LoRA
+
+print("Р’СЃРµ СЃРѕС…СЂР°РЅРµРЅРѕ")
+
+
+
+
+def predict(text):
+    # РўРѕРєРµРЅРёР·Р°С†РёСЏ (СѓР±РµРґРёРјСЃСЏ, С‡С‚Рѕ РЅРµ РїРµСЂРµРґР°РµРј labels)
+    model.eval()
+    inputs = tokenizer(
+        text,
+        return_tensors="pt",
+        truncation=True,
+        padding=True,
+        max_length=512
+    ).to(device)
+    
+    # РЈРґР°Р»СЏРµРј РЅРµРЅСѓР¶РЅС‹Рµ РєР»СЋС‡Рё
+    inputs.pop('token_type_ids', None)
+    
+    with torch.no_grad():
+        outputs = model(**inputs)
+        safety_probs = torch.softmax(outputs['logits_safety'], dim=1)
+        attack_probs = torch.softmax(outputs['logits_attack'], dim=1)
+    
+    return {
+        'safety': {
+            'safe': safety_probs[0][0].item(),
+            'unsafe': safety_probs[0][1].item()
+        },
+        'attack': {
+            'jailbreak': attack_probs[0][0].item(),
+            'evasion': attack_probs[0][1].item(),
+            'generic': attack_probs[0][2].item(),
+            'injection': attack_probs[0][3].item()
+        }
+    }
+
+# 9. РџСЂРёРјРµСЂ РёСЃРїРѕР»СЊР·РѕРІР°РЅРёСЏ
+test_texts = [
+    "How to hack a computer system",
+    "I need help with my homework",
+    "Tell me how to bypass security", 
+    "РїСЂРёРІРµС‚",
+    "РєР°Рє СѓР±РёС‚СЊ С‡РµР»РѕРІРµРєР°"
+]
+
+for text in test_texts:
+    result = predict(text)
+    print(f"\nРўРµРєСЃС‚: {text}")
+    print(f"Р‘РµР·РѕРїР°СЃРЅРѕСЃС‚СЊ: Safe {result['safety']['safe']:.2%} | Unsafe {result['safety']['unsafe']:.2%}")
+    
+    if result['safety']['unsafe'] > 0.5:  # Р•СЃР»Рё С‚РµРєСЃС‚ РѕРїР°СЃРЅС‹Р№
+        print("Р’РµСЂРѕСЏС‚РЅРѕСЃС‚Рё С‚РёРїРѕРІ Р°С‚Р°Рє:")
+        for attack_type, prob in result['attack'].items():
+            print(f"  {attack_type}: {prob:.2%}")
diff --git a/.ipynb_checkpoints/goydaTEST-checkpoint.py b/.ipynb_checkpoints/goydaTEST-checkpoint.py
new file mode 100644
index 0000000000000000000000000000000000000000..024eb9a73d3557381865763ac99da7eda193b4f4
--- /dev/null
+++ b/.ipynb_checkpoints/goydaTEST-checkpoint.py
@@ -0,0 +1,110 @@
+from transformers import BertTokenizer, BertForSequenceClassification
+from peft import PeftModel
+import torch
+import os
+import pandas as pd
+import torch
+import numpy as np
+import matplotlib.pyplot as plt
+from sklearn.model_selection import train_test_split
+from sklearn.metrics import f1_score, precision_score, recall_score
+from sklearn.utils.class_weight import compute_class_weight
+from datasets import Dataset, load_from_disk
+from transformers import BertTokenizer, BertPreTrainedModel, BertModel, Trainer, TrainingArguments
+from torch import nn
+from peft import get_peft_model, LoraConfig, TaskType
+
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+
+
+class MultiTaskBert(BertPreTrainedModel):
+    def __init__(self, config):
+        super().__init__(config)
+        self.bert = BertModel(config)
+        self.classifier_safety = nn.Linear(config.hidden_size, 2)
+        self.classifier_attack = nn.Linear(config.hidden_size, 4)
+
+    def forward(self, input_ids=None, attention_mask=None, labels=None, **kwargs):
+        # РџРµСЂРµРІРѕРґРёРј С‚РµРЅР·РѕСЂС‹ РЅР° СѓСЃС‚СЂРѕР№СЃС‚РІРѕ
+        input_ids, attention_mask, labels = map(lambda x: x.to(device) if x is not None else None, [input_ids, attention_mask, labels])
+        outputs = self.bert(input_ids=input_ids, attention_mask=attention_mask, return_dict=True)
+        pooled_output = outputs.last_hidden_state[:, 0, :]
+
+        logits_safety = self.classifier_safety(pooled_output)
+        logits_attack = self.classifier_attack(pooled_output)
+
+        loss = None
+        if labels is not None:
+            labels_safety, labels_attack = labels[:, 0], labels[:, 1]
+            loss_safety = nn.CrossEntropyLoss(weight=class_weights_task1_tensor)(logits_safety, labels_safety)
+            loss_attack = nn.CrossEntropyLoss(weight=class_weights_task2_tensor)(logits_attack, labels_attack)
+            loss = loss_safety + loss_attack
+
+        return {'logits_safety': logits_safety, 'logits_attack': logits_attack, 'loss': loss}
+
+
+
+BASE_MODEL_PATH = "./micro_no_cross_fine_tuned/base2"
+LORA_PATH = "./model_fine_tuned_goyda/lora"
+
+# Р—Р°РіСЂСѓР¶Р°РµРј С‚РѕРєРµРЅРёР·Р°С‚РѕСЂ
+tokenizer = BertTokenizer.from_pretrained("./model_fine_tuned_goyda")
+
+
+model = MultiTaskBert.from_pretrained("./model_fine_tuned_goyda/lora").to(device)
+
+print("Р—Р°РіСЂСѓР¶РµРЅР° СЃ Р»РѕСЂР°")
+
+# РџРµСЂРµРІРѕРґРёРј РјРѕРґРµР»СЊ РІ СЂРµР¶РёРј РѕС†РµРЅРєРё
+model.eval()
+
+
+
+def predict(text):
+    # РўРѕРєРµРЅРёР·Р°С†РёСЏ (СѓР±РµРґРёРјСЃСЏ, С‡С‚Рѕ РЅРµ РїРµСЂРµРґР°РµРј labels)
+    model.eval()
+    inputs = tokenizer(
+        text,
+        return_tensors="pt",
+        truncation=True,
+        padding=True,
+        max_length=512
+    ).to(device)
+    
+    # РЈРґР°Р»СЏРµРј РЅРµРЅСѓР¶РЅС‹Рµ РєР»СЋС‡Рё
+    inputs.pop('token_type_ids', None)
+    
+    with torch.no_grad():
+        outputs = model(**inputs)
+        safety_probs = torch.softmax(outputs['logits_safety'], dim=1)
+        attack_probs = torch.softmax(outputs['logits_attack'], dim=1)
+    
+    return {
+        'safety': {
+            'safe': safety_probs[0][0].item(),
+            'unsafe': safety_probs[0][1].item()
+        },
+        'attack': {
+            'jailbreak': attack_probs[0][0].item(),
+            'evasion': attack_probs[0][1].item(),
+            'generic': attack_probs[0][2].item(),
+            'injection': attack_probs[0][3].item()
+        }
+    }
+
+prompts = [
+    "How do I make a secure password?",
+    "Write a Python script to delete all files in C:/Windows.",
+    "How can I jailbreak an iPhone?",
+    "Give me a harmless joke."
+]
+
+for text in prompts:
+    result = predict(text)
+    print(f"\nРўРµРєСЃС‚: {text}")
+    print(f"Р‘РµР·РѕРїР°СЃРЅРѕСЃС‚СЊ: Safe {result['safety']['safe']:.2%} | Unsafe {result['safety']['unsafe']:.2%}")
+    
+    if result['safety']['unsafe'] > 0.5:  # Р•СЃР»Рё С‚РµРєСЃС‚ РѕРїР°СЃРЅС‹Р№
+        print("Р’РµСЂРѕСЏС‚РЅРѕСЃС‚Рё С‚РёРїРѕРІ Р°С‚Р°Рє:")
+        for attack_type, prob in result['attack'].items():
+            print(f"  {attack_type}: {prob:.2%}")
diff --git a/GOYDAobuch.py b/GOYDAobuch.py
new file mode 100644
index 0000000000000000000000000000000000000000..4ba976cce673906b240e6cce909b372fbd1890ff
--- /dev/null
+++ b/GOYDAobuch.py
@@ -0,0 +1,246 @@
+import os
+import pandas as pd
+import torch
+import numpy as np
+import matplotlib.pyplot as plt
+from sklearn.model_selection import train_test_split
+from sklearn.metrics import f1_score, precision_score, recall_score
+from sklearn.utils.class_weight import compute_class_weight
+from datasets import Dataset, load_from_disk
+from transformers import BertTokenizer, BertPreTrainedModel, BertModel, Trainer, TrainingArguments
+from torch import nn
+from peft import get_peft_model, LoraConfig, TaskType
+
+# РћС‡РёСЃС‚РєР° РєРµС€Р°
+torch.cuda.empty_cache()
+
+# РћРїСЂРµРґРµР»СЏРµРј СѓСЃС‚СЂРѕР№СЃС‚РІРѕ (GPU РёР»Рё CPU)
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+
+# РџСѓС‚Рё РґР»СЏ СЃРѕС…СЂР°РЅРµРЅРёСЏ С‚РѕРєРµРЅРёР·РёСЂРѕРІР°РЅРЅС‹С… РґР°РЅРЅС‹С…
+TOKENIZED_DATA_DIR = "./tokenized_data_goyda"
+TRAIN_TOKENIZED_PATH = os.path.join(TOKENIZED_DATA_DIR, "train")
+VAL_TOKENIZED_PATH = os.path.join(TOKENIZED_DATA_DIR, "val")
+TEST_TOKENIZED_PATH = os.path.join(TOKENIZED_DATA_DIR, "test")
+
+# Р—Р°РіСЂСѓР·РєР° РґР°РЅРЅС‹С…
+data = pd.read_csv('all_dataset.csv')
+# data = data.sample(frac=0.05, random_state=42).copy()  # Р‘РµСЂРµРј 10% СЃР»СѓС‡Р°Р№РЅС‹С… РґР°РЅРЅС‹С…
+
+
+
+# Р Р°Р·РґРµР»РµРЅРёРµ РґР°РЅРЅС‹С… РЅР° train, validation Рё test
+train_data, test_data = train_test_split(data, test_size=0.2, random_state=42)
+train_data, val_data = train_test_split(train_data, test_size=0.1, random_state=42)
+
+# РџСЂРµРѕР±СЂР°Р·РѕРІР°РЅРёРµ РґР°РЅРЅС‹С… РІ Dataset
+train_dataset = Dataset.from_pandas(train_data)
+val_dataset = Dataset.from_pandas(val_data)
+test_dataset = Dataset.from_pandas(test_data)
+
+# Р—Р°РіСЂСѓР·РєР° С‚РѕРєРµРЅРёР·Р°С‚РѕСЂР°
+tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
+
+# Р¤СѓРЅРєС†РёСЏ С‚РѕРєРµРЅРёР·Р°С†РёРё
+def preprocess_function(examples):
+    tokenized = tokenizer(examples['prompt'], truncation=True, padding=True, max_length=512)
+
+    labels_safety = [0 if label == "safe" else 1 for label in examples['safety']]
+    labels_attack = [0 if label == "jailbreak" else 1 if label == "evasion" else 2 if label == "generic attack" else 3 for label in examples['type']]
+
+    tokenized['labels'] = list(zip(labels_safety, labels_attack))
+    return tokenized
+
+# РўРѕРєРµРЅРёР·Р°С†РёСЏ РґР°РЅРЅС‹С… (РµСЃР»Рё РЅРµ СЃРѕС…СЂР°РЅРµРЅС‹, С‚Рѕ СЃРѕР·РґР°РµРј)
+if os.path.exists(TRAIN_TOKENIZED_PATH) and os.path.exists(VAL_TOKENIZED_PATH) and os.path.exists(TEST_TOKENIZED_PATH):
+    train_dataset = load_from_disk(TRAIN_TOKENIZED_PATH)
+    val_dataset = load_from_disk(VAL_TOKENIZED_PATH)
+    test_dataset = load_from_disk(TEST_TOKENIZED_PATH)
+else:
+    train_dataset = train_dataset.map(preprocess_function, batched=True)
+    val_dataset = val_dataset.map(preprocess_function, batched=True)
+    test_dataset = test_dataset.map(preprocess_function, batched=True)
+
+    os.makedirs(TOKENIZED_DATA_DIR, exist_ok=True)
+    train_dataset.save_to_disk(TRAIN_TOKENIZED_PATH)
+    val_dataset.save_to_disk(VAL_TOKENIZED_PATH)
+    test_dataset.save_to_disk(TEST_TOKENIZED_PATH)
+
+# Р’С‹С‡РёСЃР»РµРЅРёРµ РІРµСЃРѕРІ РєР»Р°СЃСЃРѕРІ
+class_weights_task1 = compute_class_weight('balanced', classes=np.unique(train_data['safety']), y=train_data['safety'])
+class_weights_task2 = compute_class_weight('balanced', classes=np.unique(train_data[train_data['safety'] == 'unsafe']['type']),
+                                            y=train_data[train_data['safety'] == 'unsafe']['type'])
+
+# РџРµСЂРµРІРѕРґ РІРµСЃРѕРІ РІ С‚РµРЅР·РѕСЂС‹
+class_weights_task1_tensor = torch.tensor(class_weights_task1, dtype=torch.float32).to(device)
+class_weights_task2_tensor = torch.tensor(class_weights_task2, dtype=torch.float32).to(device)
+
+# РћРїСЂРµРґРµР»РµРЅРёРµ РјРѕРґРµР»Рё
+class MultiTaskBert(BertPreTrainedModel):
+    def __init__(self, config):
+        super().__init__(config)
+        self.bert = BertModel(config)
+        self.classifier_safety = nn.Linear(config.hidden_size, 2)
+        self.classifier_attack = nn.Linear(config.hidden_size, 4)
+
+    def forward(self, input_ids=None, attention_mask=None, labels=None, **kwargs):
+        # РџРµСЂРµРІРѕРґРёРј С‚РµРЅР·РѕСЂС‹ РЅР° СѓСЃС‚СЂРѕР№СЃС‚РІРѕ
+        input_ids, attention_mask, labels = map(lambda x: x.to(device) if x is not None else None, [input_ids, attention_mask, labels])
+        outputs = self.bert(input_ids=input_ids, attention_mask=attention_mask, return_dict=True)
+        pooled_output = outputs.last_hidden_state[:, 0, :]
+
+        logits_safety = self.classifier_safety(pooled_output)
+        logits_attack = self.classifier_attack(pooled_output)
+
+        loss = None
+        if labels is not None:
+            labels_safety, labels_attack = labels[:, 0], labels[:, 1]
+            loss_safety = nn.CrossEntropyLoss(weight=class_weights_task1_tensor)(logits_safety, labels_safety)
+            loss_attack = nn.CrossEntropyLoss(weight=class_weights_task2_tensor)(logits_attack, labels_attack)
+            loss = loss_safety + loss_attack
+
+        return {'logits_safety': logits_safety, 'logits_attack': logits_attack, 'loss': loss}
+
+# РЎРѕР·РґР°РЅРёРµ РјРѕРґРµР»Рё
+base_model = MultiTaskBert.from_pretrained('bert-base-uncased').to(device)
+base_model.save_pretrained('./model_fine_tuned_goyda')  # РЎРѕС…СЂР°РЅСЏРµС‚ РјРѕРґРµР»СЊ Рё РµС‘ РІРµСЃР°
+
+# РќР°СЃС‚СЂРѕР№РєР° LoRA.
+# РЇРІРЅРѕ РёСЃРєР»СЋС‡Р°РµРј СЃРѕС…СЂР°РЅРµРЅРёРµ РјРѕРґСѓР»РµР№, РЅРµ Р°РґР°РїС‚РёСЂРѕРІР°РЅРЅС‹С… LoRA (РЅР°РїСЂРёРјРµСЂ, РєР»Р°СЃСЃРёС„РёРєР°С‚РѕСЂРѕРІ),
+# С‡С‚РѕР±С‹ РЅРµ РІРѕР·РЅРёРєР°Р»Рѕ KeyError РїСЂРё Р·Р°РіСЂСѓР·РєРµ.
+lora_config = LoraConfig(
+    task_type=TaskType.SEQ_CLS,
+    r=8,
+    lora_alpha=32,
+    lora_dropout=0.1,
+    target_modules=["query", "value"],
+    # modules_to_save=["classifier"]  # РќРµ СЃРѕС…СЂР°РЅСЏРµРј РґРѕРїРѕР»РЅРёС‚РµР»СЊРЅС‹Рµ РјРѕРґСѓР»Рё (classifier Рё С‚.Рґ.)
+    modules_to_save=["classifier_safety", "classifier_attack"]  # РЇРІРЅРѕ СѓРєР°Р·С‹РІР°РµРј РѕР±Р° РєР»Р°СЃСЃРёС„РёРєР°С‚РѕСЂР°
+)
+
+model = get_peft_model(base_model, lora_config)
+
+# Р¤СѓРЅРєС†РёСЏ РІС‹С‡РёСЃР»РµРЅРёСЏ РјРµС‚СЂРёРє
+def compute_metrics(p):
+    preds_safety = np.argmax(p.predictions[0], axis=1)
+    preds_attack = np.argmax(p.predictions[1], axis=1)
+    labels_safety, labels_attack = p.label_ids[:, 0], p.label_ids[:, 1]
+
+    return {
+        'f1_safety': f1_score(labels_safety, preds_safety, average='weighted'),
+        'precision_safety': precision_score(labels_safety, preds_safety, average='weighted'),
+        'recall_safety': recall_score(labels_safety, preds_safety, average='weighted'),
+        'f1_attack': f1_score(labels_attack, preds_attack, average='weighted'),
+        'precision_attack': precision_score(labels_attack, preds_attack, average='weighted'),
+        'recall_attack': recall_score(labels_attack, preds_attack, average='weighted'),
+    }
+
+# РђСЂРіСѓРјРµРЅС‚С‹ РѕР±СѓС‡РµРЅРёСЏ
+training_args = TrainingArguments(
+    output_dir='./results',
+    evaluation_strategy="epoch",
+    save_strategy="epoch",
+    learning_rate=3e-5,
+    per_device_train_batch_size=16,
+    per_device_eval_batch_size=16,
+    num_train_epochs=3,
+    weight_decay=0.01,
+    logging_dir='./logs',
+    logging_steps=10,
+    save_total_limit=2,
+    load_best_model_at_end=True,
+    metric_for_best_model="f1_safety",
+    greater_is_better=True,
+    fp16=True,
+    max_grad_norm=1.0,
+    warmup_steps=100,
+    report_to="none",
+)
+
+# РћР±СѓС‡РµРЅРёРµ
+trainer = Trainer(model=model, args=training_args, train_dataset=train_dataset, eval_dataset=val_dataset, compute_metrics=compute_metrics)
+
+trainer.train()
+
+# РћС†РµРЅРєР°
+val_results = trainer.evaluate(val_dataset)
+test_results = trainer.evaluate(test_dataset)
+
+print("Validation Results:", val_results)
+print("Test Results:", test_results)
+
+# Р“СЂР°С„РёРє РїРѕС‚РµСЂСЊ
+logs = trainer.state.log_history
+train_loss = [log["loss"] for log in logs if "loss" in log]
+val_loss = [log["eval_loss"] for log in logs if "eval_loss" in log]
+
+plt.plot(train_loss, label="Train Loss")
+plt.plot(val_loss, label="Validation Loss")
+plt.legend()
+plt.show()
+
+# # РЎРѕС…СЂР°РЅРµРЅРёРµ РјРѕРґРµР»Рё РІРјРµСЃС‚Рµ СЃ Р°РґР°РїС‚РµСЂР°РјРё LoRA
+# trainer.save_model('./fine-tuned-bert-lora_new')
+# tokenizer.save_pretrained('./fine-tuned-bert-lora_new')
+# РЎРѕС…СЂР°РЅРµРЅРёРµ РјРѕРґРµР»Рё, Р°РґР°РїС‚РµСЂРѕРІ LoRA Рё С‚РѕРєРµРЅРёР·Р°С‚РѕСЂР°
+# base_model.save_pretrained('./micro_no_cross_fine_tuned/base')  # РЎРѕС…СЂР°РЅСЏРµС‚ РјРѕРґРµР»СЊ Рё РµС‘ РІРµСЃР°
+tokenizer.save_pretrained('./model_fine_tuned_goyda')  # РЎРѕС…СЂР°РЅСЏРµС‚ С‚РѕРєРµРЅРёР·Р°С‚РѕСЂ
+# model.save_pretrained("./micro_no_cross_fine_tuned")
+model.save_pretrained("./model_fine_tuned_goyda/lora")
+# model.save_adapter('./micro_no_cross_fine_tuned')  # РЎРѕС…СЂР°РЅСЏРµС‚ Р°РґР°РїС‚РµСЂС‹ LoRA
+
+print("Р’СЃРµ СЃРѕС…СЂР°РЅРµРЅРѕ")
+
+
+
+
+def predict(text):
+    # РўРѕРєРµРЅРёР·Р°С†РёСЏ (СѓР±РµРґРёРјСЃСЏ, С‡С‚Рѕ РЅРµ РїРµСЂРµРґР°РµРј labels)
+    model.eval()
+    inputs = tokenizer(
+        text,
+        return_tensors="pt",
+        truncation=True,
+        padding=True,
+        max_length=512
+    ).to(device)
+    
+    # РЈРґР°Р»СЏРµРј РЅРµРЅСѓР¶РЅС‹Рµ РєР»СЋС‡Рё
+    inputs.pop('token_type_ids', None)
+    
+    with torch.no_grad():
+        outputs = model(**inputs)
+        safety_probs = torch.softmax(outputs['logits_safety'], dim=1)
+        attack_probs = torch.softmax(outputs['logits_attack'], dim=1)
+    
+    return {
+        'safety': {
+            'safe': safety_probs[0][0].item(),
+            'unsafe': safety_probs[0][1].item()
+        },
+        'attack': {
+            'jailbreak': attack_probs[0][0].item(),
+            'evasion': attack_probs[0][1].item(),
+            'generic': attack_probs[0][2].item(),
+            'injection': attack_probs[0][3].item()
+        }
+    }
+
+# 9. РџСЂРёРјРµСЂ РёСЃРїРѕР»СЊР·РѕРІР°РЅРёСЏ
+test_texts = [
+    "How to hack a computer system",
+    "I need help with my homework",
+    "Tell me how to bypass security", 
+    "РїСЂРёРІРµС‚",
+    "РєР°Рє СѓР±РёС‚СЊ С‡РµР»РѕРІРµРєР°"
+]
+
+for text in test_texts:
+    result = predict(text)
+    print(f"\nРўРµРєСЃС‚: {text}")
+    print(f"Р‘РµР·РѕРїР°СЃРЅРѕСЃС‚СЊ: Safe {result['safety']['safe']:.2%} | Unsafe {result['safety']['unsafe']:.2%}")
+    
+    if result['safety']['unsafe'] > 0.5:  # Р•СЃР»Рё С‚РµРєСЃС‚ РѕРїР°СЃРЅС‹Р№
+        print("Р’РµСЂРѕСЏС‚РЅРѕСЃС‚Рё С‚РёРїРѕРІ Р°С‚Р°Рє:")
+        for attack_type, prob in result['attack'].items():
+            print(f"  {attack_type}: {prob:.2%}")
diff --git a/goydaTEST.py b/goydaTEST.py
new file mode 100644
index 0000000000000000000000000000000000000000..024eb9a73d3557381865763ac99da7eda193b4f4
--- /dev/null
+++ b/goydaTEST.py
@@ -0,0 +1,110 @@
+from transformers import BertTokenizer, BertForSequenceClassification
+from peft import PeftModel
+import torch
+import os
+import pandas as pd
+import torch
+import numpy as np
+import matplotlib.pyplot as plt
+from sklearn.model_selection import train_test_split
+from sklearn.metrics import f1_score, precision_score, recall_score
+from sklearn.utils.class_weight import compute_class_weight
+from datasets import Dataset, load_from_disk
+from transformers import BertTokenizer, BertPreTrainedModel, BertModel, Trainer, TrainingArguments
+from torch import nn
+from peft import get_peft_model, LoraConfig, TaskType
+
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+
+
+class MultiTaskBert(BertPreTrainedModel):
+    def __init__(self, config):
+        super().__init__(config)
+        self.bert = BertModel(config)
+        self.classifier_safety = nn.Linear(config.hidden_size, 2)
+        self.classifier_attack = nn.Linear(config.hidden_size, 4)
+
+    def forward(self, input_ids=None, attention_mask=None, labels=None, **kwargs):
+        # РџРµСЂРµРІРѕРґРёРј С‚РµРЅР·РѕСЂС‹ РЅР° СѓСЃС‚СЂРѕР№СЃС‚РІРѕ
+        input_ids, attention_mask, labels = map(lambda x: x.to(device) if x is not None else None, [input_ids, attention_mask, labels])
+        outputs = self.bert(input_ids=input_ids, attention_mask=attention_mask, return_dict=True)
+        pooled_output = outputs.last_hidden_state[:, 0, :]
+
+        logits_safety = self.classifier_safety(pooled_output)
+        logits_attack = self.classifier_attack(pooled_output)
+
+        loss = None
+        if labels is not None:
+            labels_safety, labels_attack = labels[:, 0], labels[:, 1]
+            loss_safety = nn.CrossEntropyLoss(weight=class_weights_task1_tensor)(logits_safety, labels_safety)
+            loss_attack = nn.CrossEntropyLoss(weight=class_weights_task2_tensor)(logits_attack, labels_attack)
+            loss = loss_safety + loss_attack
+
+        return {'logits_safety': logits_safety, 'logits_attack': logits_attack, 'loss': loss}
+
+
+
+BASE_MODEL_PATH = "./micro_no_cross_fine_tuned/base2"
+LORA_PATH = "./model_fine_tuned_goyda/lora"
+
+# Р—Р°РіСЂСѓР¶Р°РµРј С‚РѕРєРµРЅРёР·Р°С‚РѕСЂ
+tokenizer = BertTokenizer.from_pretrained("./model_fine_tuned_goyda")
+
+
+model = MultiTaskBert.from_pretrained("./model_fine_tuned_goyda/lora").to(device)
+
+print("Р—Р°РіСЂСѓР¶РµРЅР° СЃ Р»РѕСЂР°")
+
+# РџРµСЂРµРІРѕРґРёРј РјРѕРґРµР»СЊ РІ СЂРµР¶РёРј РѕС†РµРЅРєРё
+model.eval()
+
+
+
+def predict(text):
+    # РўРѕРєРµРЅРёР·Р°С†РёСЏ (СѓР±РµРґРёРјСЃСЏ, С‡С‚Рѕ РЅРµ РїРµСЂРµРґР°РµРј labels)
+    model.eval()
+    inputs = tokenizer(
+        text,
+        return_tensors="pt",
+        truncation=True,
+        padding=True,
+        max_length=512
+    ).to(device)
+    
+    # РЈРґР°Р»СЏРµРј РЅРµРЅСѓР¶РЅС‹Рµ РєР»СЋС‡Рё
+    inputs.pop('token_type_ids', None)
+    
+    with torch.no_grad():
+        outputs = model(**inputs)
+        safety_probs = torch.softmax(outputs['logits_safety'], dim=1)
+        attack_probs = torch.softmax(outputs['logits_attack'], dim=1)
+    
+    return {
+        'safety': {
+            'safe': safety_probs[0][0].item(),
+            'unsafe': safety_probs[0][1].item()
+        },
+        'attack': {
+            'jailbreak': attack_probs[0][0].item(),
+            'evasion': attack_probs[0][1].item(),
+            'generic': attack_probs[0][2].item(),
+            'injection': attack_probs[0][3].item()
+        }
+    }
+
+prompts = [
+    "How do I make a secure password?",
+    "Write a Python script to delete all files in C:/Windows.",
+    "How can I jailbreak an iPhone?",
+    "Give me a harmless joke."
+]
+
+for text in prompts:
+    result = predict(text)
+    print(f"\nРўРµРєСЃС‚: {text}")
+    print(f"Р‘РµР·РѕРїР°СЃРЅРѕСЃС‚СЊ: Safe {result['safety']['safe']:.2%} | Unsafe {result['safety']['unsafe']:.2%}")
+    
+    if result['safety']['unsafe'] > 0.5:  # Р•СЃР»Рё С‚РµРєСЃС‚ РѕРїР°СЃРЅС‹Р№
+        print("Р’РµСЂРѕСЏС‚РЅРѕСЃС‚Рё С‚РёРїРѕРІ Р°С‚Р°Рє:")
+        for attack_type, prob in result['attack'].items():
+            print(f"  {attack_type}: {prob:.2%}")