microsoft · romanlutz · May 23, 2026 · May 23, 2026 · May 23, 2026
diff --git a/doc/code/datasets/1_loading_datasets.ipynb b/doc/code/datasets/1_loading_datasets.ipynb
@@ -73,10 +73,20 @@
        " 'airt_scams',\n",
        " 'airt_sexual',\n",
        " 'airt_violence',\n",
-       " 'aya_redteaming',\n",
-       " 'babelscape_alert',\n",
+       " 'aya_redteaming_arabic',\n",
+       " 'aya_redteaming_english',\n",
+       " 'aya_redteaming_french',\n",
+       " 'aya_redteaming_hindi',\n",
+       " 'aya_redteaming_russian',\n",
+       " 'aya_redteaming_serbian',\n",
+       " 'aya_redteaming_spanish',\n",
+       " 'aya_redteaming_tagalog',\n",
+       " 'babelscape_alert_adversarial',\n",
+       " 'babelscape_alert_original',\n",
        " 'beaver_tails',\n",
-       " 'categorical_harmful_qa',\n",
+       " 'categorical_harmful_qa_chinese',\n",
+       " 'categorical_harmful_qa_english',\n",
+       " 'categorical_harmful_qa_vietnamese',\n",
        " 'cbt_bench',\n",
        " 'ccp_sensitive_prompts',\n",
        " 'comic_jailbreak',\n",
@@ -90,7 +100,8 @@
        " 'harmbench',\n",
        " 'harmbench_multimodal',\n",
        " 'harmful_qa',\n",
-       " 'hixstest',\n",
+       " 'hixstest_english',\n",
+       " 'hixstest_hindi',\n",
        " 'jbb_behaviors',\n",
        " 'librai_do_not_answer',\n",
        " 'llm_lat_harmful',\n",
@@ -99,6 +110,16 @@
        " 'ml_vlsu',\n",
        " 'mlcommons_ailuminate',\n",
        " 'msts',\n",
+       " 'msts_arabic',\n",
+       " 'msts_chinese',\n",
+       " 'msts_farsi',\n",
+       " 'msts_french',\n",
+       " 'msts_german',\n",
+       " 'msts_hindi',\n",
+       " 'msts_italian',\n",
+       " 'msts_korean',\n",
+       " 'msts_russian',\n",
+       " 'msts_spanish',\n",
        " 'multilingual_vulnerability',\n",
        " 'or_bench_80k',\n",
        " 'or_bench_hard',\n",
@@ -108,7 +129,9 @@
        " 'psfuzz_steal_system_prompt',\n",
        " 'pyrit_example_dataset',\n",
        " 'red_team_social_bias',\n",
-       " 'salad_bench',\n",
+       " 'salad_bench_attack_enhanced',\n",
+       " 'salad_bench_base',\n",
+       " 'salad_bench_defense_enhanced',\n",
        " 'sgxstest',\n",
        " 'simple_safety_tests',\n",
        " 'sorry_bench',\n",
@@ -117,7 +140,9 @@
        " 'toxic_chat',\n",
        " 'transphobia_awareness',\n",
        " 'visual_leak_bench',\n",
-       " 'vlguard',\n",
+       " 'vlguard_safe_safes',\n",
+       " 'vlguard_safe_unsafes',\n",
+       " 'vlguard_unsafes',\n",
        " 'xstest']"
       ]
      },

diff --git a/pyrit/datasets/seed_datasets/remote/__init__.py b/pyrit/datasets/seed_datasets/remote/__init__.py
@@ -11,16 +11,28 @@
     _AegisContentSafetyDataset,
 )  # noqa: F401
 from pyrit.datasets.seed_datasets.remote.aya_redteaming_dataset import (
+    AyaHarmCategory,
+    AyaLanguage,
+    _AyaRedteamingArabicDataset,
     _AyaRedteamingDataset,
+    _AyaRedteamingFrenchDataset,
+    _AyaRedteamingHindiDataset,
+    _AyaRedteamingRussianDataset,
+    _AyaRedteamingSerbianDataset,
+    _AyaRedteamingSpanishDataset,
+    _AyaRedteamingTagalogDataset,
 )  # noqa: F401
 from pyrit.datasets.seed_datasets.remote.babelscape_alert_dataset import (
     _BabelscapeAlertDataset,
+    _BabelscapeAlertOriginalDataset,
 )  # noqa: F401
 from pyrit.datasets.seed_datasets.remote.beaver_tails_dataset import (
     _BeaverTailsDataset,
 )  # noqa: F401
 from pyrit.datasets.seed_datasets.remote.categorical_harmful_qa_dataset import (
+    _CategoricalHarmfulQAChineseDataset,
     _CategoricalHarmfulQADataset,
+    _CategoricalHarmfulQAVietnameseDataset,
 )  # noqa: F401
 from pyrit.datasets.seed_datasets.remote.cbt_bench_dataset import (
     _CBTBenchDataset,
@@ -57,6 +69,7 @@
 from pyrit.datasets.seed_datasets.remote.hixstest_dataset import (
     HiXSTestLanguage,
     _HiXSTestDataset,
+    _HiXSTestEnglishDataset,
 )  # noqa: F401
 from pyrit.datasets.seed_datasets.remote.jbb_behaviors_dataset import (
     _JBBBehaviorsDataset,
@@ -74,7 +87,17 @@
     _MLCommonsAILuminateDataset,
 )  # noqa: F401
 from pyrit.datasets.seed_datasets.remote.msts_dataset import (
+    _MSTSArabicDataset,
+    _MSTSChineseDataset,
     _MSTSDataset,
+    _MSTSFarsiDataset,
+    _MSTSFrenchDataset,
+    _MSTSGermanDataset,
+    _MSTSHindiDataset,
+    _MSTSItalianDataset,
+    _MSTSKoreanDataset,
+    _MSTSRussianDataset,
+    _MSTSSpanishDataset,
 )  # noqa: F401
 from pyrit.datasets.seed_datasets.remote.multilingual_vulnerability_dataset import (  # noqa: F401
     _MultilingualVulnerabilityDataset,
@@ -99,7 +122,9 @@
     _RemoteDatasetLoader,
 )
 from pyrit.datasets.seed_datasets.remote.salad_bench_dataset import (
+    _SaladBenchAttackEnhancedDataset,
     _SaladBenchDataset,
+    _SaladBenchDefenseEnhancedDataset,
 )  # noqa: F401
 from pyrit.datasets.seed_datasets.remote.sgxstest_dataset import (
     SGXSTestLabel,
@@ -133,6 +158,8 @@
     VLGuardSubcategory,
     VLGuardSubset,
     _VLGuardDataset,
+    _VLGuardSafeSafesDataset,
+    _VLGuardSafeUnsafesDataset,
 )  # noqa: F401
 from pyrit.datasets.seed_datasets.remote.vlsu_multimodal_dataset import (
     _VLSUMultimodalDataset,
@@ -142,6 +169,8 @@
 )  # noqa: F401
 
 __all__ = [
+    "AyaHarmCategory",
+    "AyaLanguage",
     "HiXSTestLanguage",
     "PromptIntelCategory",
     "PromptIntelSeverity",
@@ -150,12 +179,22 @@
     "VLGuardSubcategory",
     "VLGuardSubset",
     "_AegisContentSafetyDataset",
+    "_AyaRedteamingArabicDataset",
     "_AyaRedteamingDataset",
+    "_AyaRedteamingFrenchDataset",
+    "_AyaRedteamingHindiDataset",
+    "_AyaRedteamingRussianDataset",
+    "_AyaRedteamingSerbianDataset",
+    "_AyaRedteamingSpanishDataset",
+    "_AyaRedteamingTagalogDataset",
     "_BabelscapeAlertDataset",
+    "_BabelscapeAlertOriginalDataset",
     "_BeaverTailsDataset",
     "_CBTBenchDataset",
     "_CCPSensitivePromptsDataset",
+    "_CategoricalHarmfulQAChineseDataset",
     "_CategoricalHarmfulQADataset",
+    "_CategoricalHarmfulQAVietnameseDataset",
     "_ComicJailbreakDataset",
     "COMIC_JAILBREAK_TEMPLATES",
     "ComicJailbreakTemplateConfig",
@@ -167,12 +206,23 @@
     "_HarmBenchMultimodalDataset",
     "_HarmfulQADataset",
     "_HiXSTestDataset",
+    "_HiXSTestEnglishDataset",
     "_JBBBehaviorsDataset",
     "_LibrAIDoNotAnswerDataset",
     "_LLMLatentAdversarialTrainingDataset",
     "_MedSafetyBenchDataset",
     "_MLCommonsAILuminateDataset",
+    "_MSTSArabicDataset",
+    "_MSTSChineseDataset",
     "_MSTSDataset",
+    "_MSTSFarsiDataset",
+    "_MSTSFrenchDataset",
+    "_MSTSGermanDataset",
+    "_MSTSHindiDataset",
+    "_MSTSItalianDataset",
+    "_MSTSKoreanDataset",
+    "_MSTSRussianDataset",
+    "_MSTSSpanishDataset",
     "_MultilingualVulnerabilityDataset",
     "_ORBench80KDataset",
     "_ORBenchHardDataset",
@@ -182,14 +232,18 @@
     "_RedTeamSocialBiasDataset",
     "_RemoteDatasetLoader",
     "_SGXSTestDataset",
+    "_SaladBenchAttackEnhancedDataset",
     "_SaladBenchDataset",
+    "_SaladBenchDefenseEnhancedDataset",
     "_SimpleSafetyTestsDataset",
     "_SOSBenchDataset",
     "_SorryBenchDataset",
     "_TDC23RedteamingDataset",
     "_ToxicChatDataset",
     "_TransphobiaAwarenessDataset",
     "_VLGuardDataset",
+    "_VLGuardSafeSafesDataset",
+    "_VLGuardSafeUnsafesDataset",
     "_VLSUMultimodalDataset",
     "_VisualLeakBenchDataset",
     "VisualLeakBenchCategory",