Skip to content

Instantly share code, notes, and snippets.

@nguyenvulebinh
Created May 27, 2023 04:49
Show Gist options
  • Save nguyenvulebinh/027930099445ae58523bd18137d7bc28 to your computer and use it in GitHub Desktop.
Save nguyenvulebinh/027930099445ae58523bd18137d7bc28 to your computer and use it in GitHub Desktop.
wav2vec2_vlsp_test.ipynb
Display the source blob
Display the rendered blob
Raw
{
"nbformat": 4,
"nbformat_minor": 0,
"metadata": {
"colab": {
"provenance": [],
"machine_shape": "hm",
"authorship_tag": "ABX9TyP1Njq6Zjp77s1wEb/KXN5l",
"include_colab_link": true
},
"kernelspec": {
"display_name": "Python 3",
"name": "python3"
},
"language_info": {
"name": "python"
},
"widgets": {
"application/vnd.jupyter.widget-state+json": {
"0d3b00b83c0040f9b165de8e8524a92b": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HBoxModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HBoxView",
"_dom_classes": [],
"_model_name": "HBoxModel",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.5.0",
"box_style": "",
"layout": "IPY_MODEL_63837a8a8ee0429a8a5e4c20beaedaaf",
"_model_module": "@jupyter-widgets/controls",
"children": [
"IPY_MODEL_4db3614ebc214bab8f8b589bc89f6725",
"IPY_MODEL_c9cc5d7e34794e4b9b06d240ab524ac6",
"IPY_MODEL_e2bb9e32e4f64d6faa27b9e3bad809d8"
]
}
},
"63837a8a8ee0429a8a5e4c20beaedaaf": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"4db3614ebc214bab8f8b589bc89f6725": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_c4bc5841f2ea4fae8c1034b1c894caca",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": "Downloading: ",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_3a1dd468741243b9bcd2ccb79454d6c1"
}
},
"c9cc5d7e34794e4b9b06d240ab524ac6": {
"model_module": "@jupyter-widgets/controls",
"model_name": "FloatProgressModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "ProgressView",
"style": "IPY_MODEL_3cd1018439db43f29a7199354a9d0323",
"_dom_classes": [],
"description": "",
"_model_name": "FloatProgressModel",
"bar_style": "success",
"max": 1947,
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": 1947,
"_view_count": null,
"_view_module_version": "1.5.0",
"orientation": "horizontal",
"min": 0,
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_6a4fb0af23b745028816ae95a829e1eb"
}
},
"e2bb9e32e4f64d6faa27b9e3bad809d8": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_8c9439139abb4cea9f29ebfe4bffcd06",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": " 4.55k/? [00:00<00:00, 11.3kB/s]",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_1960e23c02744f0586b754b01efb29fc"
}
},
"c4bc5841f2ea4fae8c1034b1c894caca": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"3a1dd468741243b9bcd2ccb79454d6c1": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"3cd1018439db43f29a7199354a9d0323": {
"model_module": "@jupyter-widgets/controls",
"model_name": "ProgressStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "ProgressStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"bar_color": null,
"_model_module": "@jupyter-widgets/controls"
}
},
"6a4fb0af23b745028816ae95a829e1eb": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"8c9439139abb4cea9f29ebfe4bffcd06": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"1960e23c02744f0586b754b01efb29fc": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"1aff7fc4351345fbbdfe37841aa08f11": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HBoxModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HBoxView",
"_dom_classes": [],
"_model_name": "HBoxModel",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.5.0",
"box_style": "",
"layout": "IPY_MODEL_0260a8e14e3c4090873dab8625ff7afd",
"_model_module": "@jupyter-widgets/controls",
"children": [
"IPY_MODEL_f2d215d18f6146e791eedf02452c668c",
"IPY_MODEL_e8e7ae7f753f4ef2b2517efec2db3387",
"IPY_MODEL_ec4f48f8ddbd426a92c713de53be12f1"
]
}
},
"0260a8e14e3c4090873dab8625ff7afd": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"f2d215d18f6146e791eedf02452c668c": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_dbc86ff0937b42668565b893ca03a3c6",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": "100%",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_972ed783418f4904be623be6c473e5f5"
}
},
"e8e7ae7f753f4ef2b2517efec2db3387": {
"model_module": "@jupyter-widgets/controls",
"model_name": "FloatProgressModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "ProgressView",
"style": "IPY_MODEL_658a16080a124e0da18bc49ce69be4b0",
"_dom_classes": [],
"description": "",
"_model_name": "FloatProgressModel",
"bar_style": "success",
"max": 761,
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": 761,
"_view_count": null,
"_view_module_version": "1.5.0",
"orientation": "horizontal",
"min": 0,
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_152d36dceed646158d8aff990acafbab"
}
},
"ec4f48f8ddbd426a92c713de53be12f1": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_af34852df5334695b5b767a3884bc91f",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": " 761/761 [02:08<00:00, 12.29ex/s]",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_fdead316ad144f608869b7c34f1d1514"
}
},
"dbc86ff0937b42668565b893ca03a3c6": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"972ed783418f4904be623be6c473e5f5": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"658a16080a124e0da18bc49ce69be4b0": {
"model_module": "@jupyter-widgets/controls",
"model_name": "ProgressStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "ProgressStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"bar_color": null,
"_model_module": "@jupyter-widgets/controls"
}
},
"152d36dceed646158d8aff990acafbab": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"af34852df5334695b5b767a3884bc91f": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"fdead316ad144f608869b7c34f1d1514": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"bab8f7dfa1cb433eb2590607d00d145a": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HBoxModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HBoxView",
"_dom_classes": [],
"_model_name": "HBoxModel",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.5.0",
"box_style": "",
"layout": "IPY_MODEL_40bf4c2e75c243738089fb6cf7d84ccf",
"_model_module": "@jupyter-widgets/controls",
"children": [
"IPY_MODEL_59bbfa81e48943988a4415484ef75b90",
"IPY_MODEL_e04588f2fec3424595135296761514fe",
"IPY_MODEL_13d7ea9f8c534e86a926a7f0489d880e"
]
}
},
"40bf4c2e75c243738089fb6cf7d84ccf": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"59bbfa81e48943988a4415484ef75b90": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_b2271d062ece426b84f45c994be562d5",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": "100%",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_60e079bbfb504abb8bd0a91f4a686c3c"
}
},
"e04588f2fec3424595135296761514fe": {
"model_module": "@jupyter-widgets/controls",
"model_name": "FloatProgressModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "ProgressView",
"style": "IPY_MODEL_16d2ea65f81c401f9728f7f0aee33743",
"_dom_classes": [],
"description": "",
"_model_name": "FloatProgressModel",
"bar_style": "success",
"max": 760,
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": 760,
"_view_count": null,
"_view_module_version": "1.5.0",
"orientation": "horizontal",
"min": 0,
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_6917305c3a5b42319348bc3f9b80e6f3"
}
},
"13d7ea9f8c534e86a926a7f0489d880e": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_00fcb86b1ad345dfa99cfe360f19ae2f",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": " 760/760 [01:00<00:00, 12.16ex/s]",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_85107cd3d5cb4395b91f4058c622fa60"
}
},
"b2271d062ece426b84f45c994be562d5": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"60e079bbfb504abb8bd0a91f4a686c3c": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"16d2ea65f81c401f9728f7f0aee33743": {
"model_module": "@jupyter-widgets/controls",
"model_name": "ProgressStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "ProgressStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"bar_color": null,
"_model_module": "@jupyter-widgets/controls"
}
},
"6917305c3a5b42319348bc3f9b80e6f3": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"00fcb86b1ad345dfa99cfe360f19ae2f": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"85107cd3d5cb4395b91f4058c622fa60": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"7dcf5b66b2f848cdb928159949f04456": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HBoxModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HBoxView",
"_dom_classes": [],
"_model_name": "HBoxModel",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.5.0",
"box_style": "",
"layout": "IPY_MODEL_4500810e43c4427e9a75088ada21da60",
"_model_module": "@jupyter-widgets/controls",
"children": [
"IPY_MODEL_0360ada0de32460aa2553f864ab1cd0c",
"IPY_MODEL_43689d3c564740f3a79840ce18f92191",
"IPY_MODEL_b2cc394b769d4589b4f3b9f7628a7c8a"
]
}
},
"4500810e43c4427e9a75088ada21da60": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"0360ada0de32460aa2553f864ab1cd0c": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_7a68cb2c83e44d6ca7274f279206c031",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": "100%",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_8ce407354781435381275d9e9cddb29d"
}
},
"43689d3c564740f3a79840ce18f92191": {
"model_module": "@jupyter-widgets/controls",
"model_name": "FloatProgressModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "ProgressView",
"style": "IPY_MODEL_324ed59451164031b302e9cd9c307f4c",
"_dom_classes": [],
"description": "",
"_model_name": "FloatProgressModel",
"bar_style": "success",
"max": 7072,
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": 7072,
"_view_count": null,
"_view_module_version": "1.5.0",
"orientation": "horizontal",
"min": 0,
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_99a5624850814ed2888a8a72f84a5fb6"
}
},
"b2cc394b769d4589b4f3b9f7628a7c8a": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_ae53136477984344bbd5fcb7d95da149",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": " 7072/7072 [21:08<00:00, 18.73ex/s]",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_8ff64fafd5174346bc60ae7554f592b5"
}
},
"7a68cb2c83e44d6ca7274f279206c031": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"8ce407354781435381275d9e9cddb29d": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"324ed59451164031b302e9cd9c307f4c": {
"model_module": "@jupyter-widgets/controls",
"model_name": "ProgressStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "ProgressStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"bar_color": null,
"_model_module": "@jupyter-widgets/controls"
}
},
"99a5624850814ed2888a8a72f84a5fb6": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"ae53136477984344bbd5fcb7d95da149": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"8ff64fafd5174346bc60ae7554f592b5": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"e85fbd4338a94e86a3d493eaf4ef4534": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HBoxModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HBoxView",
"_dom_classes": [],
"_model_name": "HBoxModel",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.5.0",
"box_style": "",
"layout": "IPY_MODEL_5c844cb17bc64aeb810e530d551c9c3c",
"_model_module": "@jupyter-widgets/controls",
"children": [
"IPY_MODEL_eaf60db5de2f4e819a5d300f2a0427d0",
"IPY_MODEL_b8fc694cf5e74da9a7a56b3ec5273aee",
"IPY_MODEL_7e7711ca5836422497af65cb8ace9d75"
]
}
},
"5c844cb17bc64aeb810e530d551c9c3c": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"eaf60db5de2f4e819a5d300f2a0427d0": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_a58fc6870d9f4e42a9a522ab59d946f5",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": "100%",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_affc0c5dd7d444c8b15a7a1986894554"
}
},
"b8fc694cf5e74da9a7a56b3ec5273aee": {
"model_module": "@jupyter-widgets/controls",
"model_name": "FloatProgressModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "ProgressView",
"style": "IPY_MODEL_34b30414c8c34df88bb9bfc30184b872",
"_dom_classes": [],
"description": "",
"_model_name": "FloatProgressModel",
"bar_style": "success",
"max": 18788,
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": 18788,
"_view_count": null,
"_view_module_version": "1.5.0",
"orientation": "horizontal",
"min": 0,
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_0ec3d5c2b54945b18cfd8924f0b6d6b4"
}
},
"7e7711ca5836422497af65cb8ace9d75": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_b14c32833fca4f948ab3270af2c3248f",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": " 18788/18788 [1:07:19<00:00, 3.40ex/s]",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_9c160e343f9245ba917f0e96fa2fb437"
}
},
"a58fc6870d9f4e42a9a522ab59d946f5": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"affc0c5dd7d444c8b15a7a1986894554": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"34b30414c8c34df88bb9bfc30184b872": {
"model_module": "@jupyter-widgets/controls",
"model_name": "ProgressStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "ProgressStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"bar_color": null,
"_model_module": "@jupyter-widgets/controls"
}
},
"0ec3d5c2b54945b18cfd8924f0b6d6b4": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"b14c32833fca4f948ab3270af2c3248f": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"9c160e343f9245ba917f0e96fa2fb437": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"2336ee0aae994d80a30cd9d665264962": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HBoxModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HBoxView",
"_dom_classes": [],
"_model_name": "HBoxModel",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.5.0",
"box_style": "",
"layout": "IPY_MODEL_2d27c26eacb24f9b9b971e41ed9db13c",
"_model_module": "@jupyter-widgets/controls",
"children": [
"IPY_MODEL_7dee256620604982bc538d1b05b897bf",
"IPY_MODEL_c51b210e33514459a2a849ab6fcd0055",
"IPY_MODEL_297f1516d87640d4b1fcee6f39ace572"
]
}
},
"2d27c26eacb24f9b9b971e41ed9db13c": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"7dee256620604982bc538d1b05b897bf": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_577cce00d25b43558a9c990130e4fde5",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": "Downloading: 100%",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_1a194381fec64895ad4f5a1a9abf539d"
}
},
"c51b210e33514459a2a849ab6fcd0055": {
"model_module": "@jupyter-widgets/controls",
"model_name": "FloatProgressModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "ProgressView",
"style": "IPY_MODEL_c3a351c6933f4effbad601f9f09f5cfe",
"_dom_classes": [],
"description": "",
"_model_name": "FloatProgressModel",
"bar_style": "success",
"max": 215,
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": 215,
"_view_count": null,
"_view_module_version": "1.5.0",
"orientation": "horizontal",
"min": 0,
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_77eedc2a3c5b443e9e38a072c594b39c"
}
},
"297f1516d87640d4b1fcee6f39ace572": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_660c05932a904626b457f617a193dfb2",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": " 215/215 [00:00<00:00, 8.76kB/s]",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_f4ac069baf24454b9a187b6c6613bf36"
}
},
"577cce00d25b43558a9c990130e4fde5": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"1a194381fec64895ad4f5a1a9abf539d": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"c3a351c6933f4effbad601f9f09f5cfe": {
"model_module": "@jupyter-widgets/controls",
"model_name": "ProgressStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "ProgressStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"bar_color": null,
"_model_module": "@jupyter-widgets/controls"
}
},
"77eedc2a3c5b443e9e38a072c594b39c": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"660c05932a904626b457f617a193dfb2": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"f4ac069baf24454b9a187b6c6613bf36": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"b15db42a25734e39bf9b2b09c1ba3f0c": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HBoxModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HBoxView",
"_dom_classes": [],
"_model_name": "HBoxModel",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.5.0",
"box_style": "",
"layout": "IPY_MODEL_8ffc95ac6a8b4f3fb21d3860ee28bc4f",
"_model_module": "@jupyter-widgets/controls",
"children": [
"IPY_MODEL_ad2d9b1d3bf440eb96b2cb0eb7893257",
"IPY_MODEL_1744c10e599d4274b3544fe617c46d59",
"IPY_MODEL_ba57184839a84c88a6e7e1ed7828b455"
]
}
},
"8ffc95ac6a8b4f3fb21d3860ee28bc4f": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"ad2d9b1d3bf440eb96b2cb0eb7893257": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_f4ccca8315f34eda9be6694edf8383a8",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": "Downloading: 100%",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_5e22a3bb93fc4827925cc75f0ea306de"
}
},
"1744c10e599d4274b3544fe617c46d59": {
"model_module": "@jupyter-widgets/controls",
"model_name": "FloatProgressModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "ProgressView",
"style": "IPY_MODEL_70a5b6adfd924d4b91bf79d7c97d339c",
"_dom_classes": [],
"description": "",
"_model_name": "FloatProgressModel",
"bar_style": "success",
"max": 1114,
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": 1114,
"_view_count": null,
"_view_module_version": "1.5.0",
"orientation": "horizontal",
"min": 0,
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_609a977174284ac5ad87138d9c8aa789"
}
},
"ba57184839a84c88a6e7e1ed7828b455": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_bbd0ebe3f7cc4546bd9dec0dd95682a3",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": " 1.11k/1.11k [00:00<00:00, 44.9kB/s]",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_9c848244f19c4ab09679e077daebd5f4"
}
},
"f4ccca8315f34eda9be6694edf8383a8": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"5e22a3bb93fc4827925cc75f0ea306de": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"70a5b6adfd924d4b91bf79d7c97d339c": {
"model_module": "@jupyter-widgets/controls",
"model_name": "ProgressStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "ProgressStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"bar_color": null,
"_model_module": "@jupyter-widgets/controls"
}
},
"609a977174284ac5ad87138d9c8aa789": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"bbd0ebe3f7cc4546bd9dec0dd95682a3": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"9c848244f19c4ab09679e077daebd5f4": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"80eaafe796d64a5a921fc1002c5f22a0": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HBoxModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HBoxView",
"_dom_classes": [],
"_model_name": "HBoxModel",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.5.0",
"box_style": "",
"layout": "IPY_MODEL_9efcb0bca9194b2cae3b7825f15c2629",
"_model_module": "@jupyter-widgets/controls",
"children": [
"IPY_MODEL_bf531bfb55a844dabf8520fa3ea28dc2",
"IPY_MODEL_0e7f955be7784613b72d06add422c540",
"IPY_MODEL_16b5f1f02a75436c94eb2be7e860b1af"
]
}
},
"9efcb0bca9194b2cae3b7825f15c2629": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"bf531bfb55a844dabf8520fa3ea28dc2": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_b95b7af4f82545eea259ce89a8089292",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": "Downloading: 100%",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_81310fb5e40c4736808d053203576bd0"
}
},
"0e7f955be7784613b72d06add422c540": {
"model_module": "@jupyter-widgets/controls",
"model_name": "FloatProgressModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "ProgressView",
"style": "IPY_MODEL_ccf7a0e2b2204a99a6977002a5e224dd",
"_dom_classes": [],
"description": "",
"_model_name": "FloatProgressModel",
"bar_style": "success",
"max": 181,
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": 181,
"_view_count": null,
"_view_module_version": "1.5.0",
"orientation": "horizontal",
"min": 0,
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_24d53211476545fe87e64432b9c370a0"
}
},
"16b5f1f02a75436c94eb2be7e860b1af": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_1cce0d6b348644f78c31ad56997d8616",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": " 181/181 [00:00<00:00, 7.39kB/s]",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_0c26f3bf3835402aa1404a300cec9e5b"
}
},
"b95b7af4f82545eea259ce89a8089292": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"81310fb5e40c4736808d053203576bd0": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"ccf7a0e2b2204a99a6977002a5e224dd": {
"model_module": "@jupyter-widgets/controls",
"model_name": "ProgressStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "ProgressStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"bar_color": null,
"_model_module": "@jupyter-widgets/controls"
}
},
"24d53211476545fe87e64432b9c370a0": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"1cce0d6b348644f78c31ad56997d8616": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"0c26f3bf3835402aa1404a300cec9e5b": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"667b4fd4b23a4c879fc60f32c5989c88": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HBoxModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HBoxView",
"_dom_classes": [],
"_model_name": "HBoxModel",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.5.0",
"box_style": "",
"layout": "IPY_MODEL_f88061d60ca74b8a9a3fa7fc8f38ff09",
"_model_module": "@jupyter-widgets/controls",
"children": [
"IPY_MODEL_0fae0c3e505d467980279054d3e15a87",
"IPY_MODEL_868d81aed9d64e098f7cd7123b2860d4",
"IPY_MODEL_a2ae2f442e0042d7a983ccab311a7f4c"
]
}
},
"f88061d60ca74b8a9a3fa7fc8f38ff09": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"0fae0c3e505d467980279054d3e15a87": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_634bffe05c4c40b1aa031b555af2cabd",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": "Downloading: 100%",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_23ada557c1aa44c29e35c03bfdbf1b9b"
}
},
"868d81aed9d64e098f7cd7123b2860d4": {
"model_module": "@jupyter-widgets/controls",
"model_name": "FloatProgressModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "ProgressView",
"style": "IPY_MODEL_74392f18de124c769ecc09bc25ad9c3d",
"_dom_classes": [],
"description": "",
"_model_name": "FloatProgressModel",
"bar_style": "success",
"max": 85,
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": 85,
"_view_count": null,
"_view_module_version": "1.5.0",
"orientation": "horizontal",
"min": 0,
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_1c17a01cd8664b9286ebd5718dacaa9d"
}
},
"a2ae2f442e0042d7a983ccab311a7f4c": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_0d5a345905b940dfb9f16e1ce16cb58c",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": " 85.0/85.0 [00:00<00:00, 3.55kB/s]",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_39dd19f88d2c4e65a992179dd71fde11"
}
},
"634bffe05c4c40b1aa031b555af2cabd": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"23ada557c1aa44c29e35c03bfdbf1b9b": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"74392f18de124c769ecc09bc25ad9c3d": {
"model_module": "@jupyter-widgets/controls",
"model_name": "ProgressStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "ProgressStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"bar_color": null,
"_model_module": "@jupyter-widgets/controls"
}
},
"1c17a01cd8664b9286ebd5718dacaa9d": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"0d5a345905b940dfb9f16e1ce16cb58c": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"39dd19f88d2c4e65a992179dd71fde11": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"32ac0964bad14718a064e1303cb76f59": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HBoxModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HBoxView",
"_dom_classes": [],
"_model_name": "HBoxModel",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.5.0",
"box_style": "",
"layout": "IPY_MODEL_206d355c23834e3ebb9a358af1798734",
"_model_module": "@jupyter-widgets/controls",
"children": [
"IPY_MODEL_aca57a480b524747a442dca17a2ba052",
"IPY_MODEL_907febb8013b4146b1bdc3e0728c15a4",
"IPY_MODEL_5d7a5acc092047f28298527e5838439c"
]
}
},
"206d355c23834e3ebb9a358af1798734": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"aca57a480b524747a442dca17a2ba052": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_ee19ad3e8837495ab622383124c37708",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": "Downloading: 100%",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_144adcef4aa047ea965544ac9ef84988"
}
},
"907febb8013b4146b1bdc3e0728c15a4": {
"model_module": "@jupyter-widgets/controls",
"model_name": "FloatProgressModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "ProgressView",
"style": "IPY_MODEL_d7d5b787f26841c881bd22fcd5ec6bd9",
"_dom_classes": [],
"description": "",
"_model_name": "FloatProgressModel",
"bar_style": "success",
"max": 1653,
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": 1653,
"_view_count": null,
"_view_module_version": "1.5.0",
"orientation": "horizontal",
"min": 0,
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_79dcc2039d494fb594b1387e11d46754"
}
},
"5d7a5acc092047f28298527e5838439c": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_844695218978471aa94ff2e259138441",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": " 1.65k/1.65k [00:00<00:00, 72.1kB/s]",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_71adcab2263d4f2aacfcd61d7373ffd4"
}
},
"ee19ad3e8837495ab622383124c37708": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"144adcef4aa047ea965544ac9ef84988": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"d7d5b787f26841c881bd22fcd5ec6bd9": {
"model_module": "@jupyter-widgets/controls",
"model_name": "ProgressStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "ProgressStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"bar_color": null,
"_model_module": "@jupyter-widgets/controls"
}
},
"79dcc2039d494fb594b1387e11d46754": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"844695218978471aa94ff2e259138441": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"71adcab2263d4f2aacfcd61d7373ffd4": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"61ab200f804f4467b2d1d94391cf06b3": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HBoxModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HBoxView",
"_dom_classes": [],
"_model_name": "HBoxModel",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.5.0",
"box_style": "",
"layout": "IPY_MODEL_8a7f4c6eea54459bae4ddd8fac318541",
"_model_module": "@jupyter-widgets/controls",
"children": [
"IPY_MODEL_4bdc7eda716149bcb4e4055d414919c7",
"IPY_MODEL_a36634c985e942cb8bad6f81c36fdcf5",
"IPY_MODEL_cc9abfbba8d5468f94eb8b6c17693bb3"
]
}
},
"8a7f4c6eea54459bae4ddd8fac318541": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"4bdc7eda716149bcb4e4055d414919c7": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_a5df2d912ce2462fa00ede50be420bc4",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": "Downloading: 100%",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_2b00c333872e41b6b75be5f2a29123ae"
}
},
"a36634c985e942cb8bad6f81c36fdcf5": {
"model_module": "@jupyter-widgets/controls",
"model_name": "FloatProgressModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "ProgressView",
"style": "IPY_MODEL_0666e6ba2e57454c89d7a9093a6b195e",
"_dom_classes": [],
"description": "",
"_model_name": "FloatProgressModel",
"bar_style": "success",
"max": 377906903,
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": 377906903,
"_view_count": null,
"_view_module_version": "1.5.0",
"orientation": "horizontal",
"min": 0,
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_11f9cf2034794a46be6cdf0daccdadae"
}
},
"cc9abfbba8d5468f94eb8b6c17693bb3": {
"model_module": "@jupyter-widgets/controls",
"model_name": "HTMLModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "HTMLView",
"style": "IPY_MODEL_bb960e43699b4ef1bfb4c8c702e428c6",
"_dom_classes": [],
"description": "",
"_model_name": "HTMLModel",
"placeholder": "​",
"_view_module": "@jupyter-widgets/controls",
"_model_module_version": "1.5.0",
"value": " 378M/378M [00:13<00:00, 29.0MB/s]",
"_view_count": null,
"_view_module_version": "1.5.0",
"description_tooltip": null,
"_model_module": "@jupyter-widgets/controls",
"layout": "IPY_MODEL_57e7963bbd13431b90d27fdf31f0fd1d"
}
},
"a5df2d912ce2462fa00ede50be420bc4": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"2b00c333872e41b6b75be5f2a29123ae": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"0666e6ba2e57454c89d7a9093a6b195e": {
"model_module": "@jupyter-widgets/controls",
"model_name": "ProgressStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "ProgressStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"bar_color": null,
"_model_module": "@jupyter-widgets/controls"
}
},
"11f9cf2034794a46be6cdf0daccdadae": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
},
"bb960e43699b4ef1bfb4c8c702e428c6": {
"model_module": "@jupyter-widgets/controls",
"model_name": "DescriptionStyleModel",
"model_module_version": "1.5.0",
"state": {
"_view_name": "StyleView",
"_model_name": "DescriptionStyleModel",
"description_width": "",
"_view_module": "@jupyter-widgets/base",
"_model_module_version": "1.5.0",
"_view_count": null,
"_view_module_version": "1.2.0",
"_model_module": "@jupyter-widgets/controls"
}
},
"57e7963bbd13431b90d27fdf31f0fd1d": {
"model_module": "@jupyter-widgets/base",
"model_name": "LayoutModel",
"model_module_version": "1.2.0",
"state": {
"_view_name": "LayoutView",
"grid_template_rows": null,
"right": null,
"justify_content": null,
"_view_module": "@jupyter-widgets/base",
"overflow": null,
"_model_module_version": "1.2.0",
"_view_count": null,
"flex_flow": null,
"width": null,
"min_width": null,
"border": null,
"align_items": null,
"bottom": null,
"_model_module": "@jupyter-widgets/base",
"top": null,
"grid_column": null,
"overflow_y": null,
"overflow_x": null,
"grid_auto_flow": null,
"grid_area": null,
"grid_template_columns": null,
"flex": null,
"_model_name": "LayoutModel",
"justify_items": null,
"grid_row": null,
"max_height": null,
"align_content": null,
"visibility": null,
"align_self": null,
"height": null,
"min_height": null,
"padding": null,
"grid_auto_rows": null,
"grid_gap": null,
"max_width": null,
"order": null,
"_view_module_version": "1.2.0",
"grid_template_areas": null,
"object_position": null,
"object_fit": null,
"grid_auto_columns": null,
"margin": null,
"display": null,
"left": null
}
}
}
},
"accelerator": "GPU"
},
"cells": [
{
"cell_type": "markdown",
"metadata": {
"id": "view-in-github",
"colab_type": "text"
},
"source": [
"<a href=\"https://colab.research.google.com/gist/nguyenvulebinh/027930099445ae58523bd18137d7bc28/wav2vec2_vlsp_test.ipynb\" target=\"_parent\"><img src=\"https://colab.research.google.com/assets/colab-badge.svg\" alt=\"Open In Colab\"/></a>"
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/"
},
"id": "R6JZVJoWMs5z",
"outputId": "6e1cd2b4-7bb0-484e-9541-a9a5bd952140"
},
"source": [
"from google.colab import drive\n",
"drive.mount('/content/drive')"
],
"execution_count": null,
"outputs": [
{
"output_type": "stream",
"name": "stdout",
"text": [
"Mounted at /content/drive\n"
]
}
]
},
{
"cell_type": "code",
"metadata": {
"id": "SRZxnzcxMag3"
},
"source": [
"!pip3 install transformers==4.9.2 soundfile datasets==1.11.0 jiwer gpustat pyctcdecode pydub torchaudio auditok gradio onnxruntime\n",
"!pip3 install https://github.com/kpu/kenlm/archive/master.zip\n",
"!sudo apt-get install git-lfs nano htop\n",
"!git lfs install"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "code",
"metadata": {
"id": "Lt5p2A1SNaW_"
},
"source": [
"from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor, Wav2Vec2CTCTokenizer, Wav2Vec2FeatureExtractor\n",
"from datasets import load_from_disk, load_metric\n",
"import torch\n",
"import torchaudio\n",
"import kenlm\n",
"from pyctcdecode import Alphabet, BeamSearchDecoderCTC, LanguageModel\n",
"import os\n",
"import google\n",
"from io import StringIO\n",
"import base64"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 49,
"referenced_widgets": [
"0d3b00b83c0040f9b165de8e8524a92b",
"63837a8a8ee0429a8a5e4c20beaedaaf",
"4db3614ebc214bab8f8b589bc89f6725",
"c9cc5d7e34794e4b9b06d240ab524ac6",
"e2bb9e32e4f64d6faa27b9e3bad809d8",
"c4bc5841f2ea4fae8c1034b1c894caca",
"3a1dd468741243b9bcd2ccb79454d6c1",
"3cd1018439db43f29a7199354a9d0323",
"6a4fb0af23b745028816ae95a829e1eb",
"8c9439139abb4cea9f29ebfe4bffcd06",
"1960e23c02744f0586b754b01efb29fc"
]
},
"id": "NnFuT5JLPBrx",
"outputId": "b688856f-3f17-48e4-a988-9764d02495c6"
},
"source": [
"wer_metric = load_metric(\"wer\")"
],
"execution_count": null,
"outputs": [
{
"output_type": "display_data",
"data": {
"application/vnd.jupyter.widget-view+json": {
"model_id": "0d3b00b83c0040f9b165de8e8524a92b",
"version_minor": 0,
"version_major": 2
},
"text/plain": [
"Downloading: 0%| | 0.00/1.95k [00:00<?, ?B/s]"
]
},
"metadata": {}
}
]
},
{
"cell_type": "code",
"metadata": {
"id": "zTJD4JPTM42j"
},
"source": [
"def get_asr_model():\n",
" pre_trained_path = '/content/vaw2tmp/model-bin/finetune/base/checkpoint-146596'\n",
" tokenizer = Wav2Vec2CTCTokenizer(\"/content/vaw2tmp/model-bin/finetune/vocab.json\",\n",
" unk_token=\"<unk>\",\n",
" pad_token=\"<pad>\",\n",
" word_delimiter_token=\"|\")\n",
"\n",
" feature_extractor = Wav2Vec2FeatureExtractor.from_pretrained(pre_trained_path)\n",
" processor = Wav2Vec2Processor(feature_extractor=feature_extractor, tokenizer=tokenizer)\n",
" # processor = Wav2Vec2Processor.from_pretrained(pre_trained_path)\n",
"\n",
" model = Wav2Vec2ForCTC.from_pretrained(\n",
" pre_trained_path,\n",
" gradient_checkpointing=True,\n",
" ctc_loss_reduction=\"mean\",\n",
" pad_token_id=processor.tokenizer.pad_token_id,\n",
" )\n",
"\n",
" return tokenizer, processor, model"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "code",
"metadata": {
"id": "-77wwU-ftXuQ"
},
"source": [
"def get_decoder_model(tokenizer):\n",
" vocab_dict = tokenizer.get_vocab()\n",
" sort_vocab = sorted((value, key) for (key, value) in vocab_dict.items())\n",
" vocab = [x[1] for x in sort_vocab]\n",
" vocab_list = vocab\n",
" # convert ctc blank character representation\n",
" vocab_list[tokenizer.pad_token_id] = \"\"\n",
" # replace special characters\n",
" vocab_list[tokenizer.unk_token_id] = \"\"\n",
" # convert space character representation\n",
" vocab_list[tokenizer.word_delimiter_token_id] = \" \"\n",
" # specify ctc blank char index, since conventially it is the last entry of the logit matrix\n",
" alphabet = Alphabet.build_alphabet(vocab_list, ctc_token_idx=tokenizer.pad_token_id)\n",
"\n",
" lm_model = kenlm.Model(\"/content/drive/MyDrive/audio_dataset/vi_lm_4grams.bin\")\n",
"\n",
" decoder = BeamSearchDecoderCTC(alphabet,\n",
" language_model=LanguageModel(lm_model))\n",
" return decoder"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "code",
"metadata": {
"id": "8wBZeJSPNxTp"
},
"source": [
"w2v_tokenizer, w2v_processor, w2v_model = get_asr_model()\n",
"w2v_ctc_decoder = get_decoder_model(w2v_tokenizer)"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "code",
"metadata": {
"id": "B8E-gSlvRCKG"
},
"source": [
"def map_to_result(batch):\n",
" input_values = w2v_processor(\n",
" batch[\"speech\"], \n",
" sampling_rate=batch[\"sampling_rate\"], \n",
" return_tensors=\"pt\"\n",
" # ).input_values.to(\"cuda\")\n",
" ).input_values\n",
"\n",
" if torch.cuda.is_available():\n",
" w2v_model.to(\"cuda\")\n",
" input_values = input_values.to(\"cuda\")\n",
"\n",
" with torch.no_grad():\n",
" logits = w2v_model(input_values).logits\n",
"\n",
" pred_ids = torch.argmax(logits, dim=-1)\n",
" batch[\"pred_str\"] = w2v_processor.batch_decode(pred_ids)[0]\n",
" batch[\"pred_str_beam\"] = w2v_ctc_decoder.decode(logits[0].cpu().numpy(), beam_width=500)\n",
"\n",
" return batch"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "code",
"metadata": {
"id": "uTNny3CtkxYE"
},
"source": [
"def speech_file_to_array_fn(path, max_seconds=-1):\n",
" batch = {\"file\": path}\n",
" speech_array, sampling_rate = torchaudio.load(batch[\"file\"])\n",
" if sampling_rate != 16000:\n",
" transform = torchaudio.transforms.Resample(orig_freq=sampling_rate,\n",
" new_freq=16000)\n",
" speech_array = transform(speech_array)\n",
" speech_array = speech_array[0]\n",
" if max_seconds > 0:\n",
" speech_array = speech_array[:max_seconds*16000]\n",
" batch[\"speech\"] = speech_array.numpy()\n",
" batch[\"sampling_rate\"] = 16000\n",
" return batch"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "code",
"metadata": {
"id": "O_uiqPPfN1z8"
},
"source": [
"test_dataset_t1 = load_from_disk('/content/drive/MyDrive/audio_dataset/vlsp_test_dataset_t1')\n",
"test_dataset_t1 = test_dataset_t1.filter(lambda example: len(example['speech']) < 160000,\n",
" batch_size=32,\n",
" num_proc=8,\n",
" cache_file_name='/content/vaw2tmp/model-bin/metrics/cache-test.arrow')"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "code",
"metadata": {
"id": "q4r3O4qwP03F"
},
"source": [
"test_dataset_t2 = load_from_disk('/content/drive/MyDrive/audio_dataset/vlsp_test_dataset_t2')\n",
"test_dataset_t2 = test_dataset_t2.filter(lambda example: len(example['speech']) < 160000,\n",
" batch_size=32,\n",
" num_proc=8,\n",
" cache_file_name='/content/vaw2tmp/model-bin/metrics/cache-t2-test.arrow')"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "code",
"metadata": {
"id": "8ijwjUtP_i-2"
},
"source": [
"test_dataset_vivos = load_from_disk('/content/drive/MyDrive/audio_dataset/vivos_test_dataset')\n",
"test_dataset_vivos = test_dataset_vivos.filter(lambda example: len(example['speech']) < 160000,\n",
" batch_size=32,\n",
" num_proc=8,\n",
" cache_file_name='/content/vaw2tmp/model-bin/metrics/cache-vivos-test.arrow')"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "code",
"metadata": {
"id": "33B2uqwo2r8m"
},
"source": [
"test_dataset_common = load_from_disk('/content/drive/MyDrive/audio_dataset/common_voice_vi')\n",
"test_dataset_common = test_dataset_common.filter(lambda example: len(example['speech']) < 160000,\n",
" batch_size=32,\n",
" num_proc=8,\n",
" cache_file_name='/content/vaw2tmp/model-bin/metrics/cache-common-voice-test.arrow')"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 83,
"referenced_widgets": [
"1aff7fc4351345fbbdfe37841aa08f11",
"0260a8e14e3c4090873dab8625ff7afd",
"f2d215d18f6146e791eedf02452c668c",
"e8e7ae7f753f4ef2b2517efec2db3387",
"ec4f48f8ddbd426a92c713de53be12f1",
"dbc86ff0937b42668565b893ca03a3c6",
"972ed783418f4904be623be6c473e5f5",
"658a16080a124e0da18bc49ce69be4b0",
"152d36dceed646158d8aff990acafbab",
"af34852df5334695b5b767a3884bc91f",
"fdead316ad144f608869b7c34f1d1514"
]
},
"id": "_LOdpM-w275E",
"outputId": "eb206bfc-af64-42b3-caaf-39355f928d76"
},
"source": [
"# COMMON VOICE VIETNAMESE\n",
"results_common = test_dataset_common.map(map_to_result)\n",
"print(\"Test WER: {:.5f}\".format(wer_metric.compute(predictions=results_common[\"pred_str\"], references=results_common[\"target_text\"])))\n",
"print(\"Test WER: {:.5f}\".format(wer_metric.compute(predictions=results_common[\"pred_str_beam\"], references=results_common[\"target_text\"])))"
],
"execution_count": null,
"outputs": [
{
"output_type": "display_data",
"data": {
"application/vnd.jupyter.widget-view+json": {
"model_id": "1aff7fc4351345fbbdfe37841aa08f11",
"version_minor": 0,
"version_major": 2
},
"text/plain": [
" 0%| | 0/761 [00:00<?, ?ex/s]"
]
},
"metadata": {}
},
{
"output_type": "stream",
"name": "stdout",
"text": [
"Test WER: 0.18344\n",
"Test WER: 0.11523\n"
]
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 83,
"referenced_widgets": [
"bab8f7dfa1cb433eb2590607d00d145a",
"40bf4c2e75c243738089fb6cf7d84ccf",
"59bbfa81e48943988a4415484ef75b90",
"e04588f2fec3424595135296761514fe",
"13d7ea9f8c534e86a926a7f0489d880e",
"b2271d062ece426b84f45c994be562d5",
"60e079bbfb504abb8bd0a91f4a686c3c",
"16d2ea65f81c401f9728f7f0aee33743",
"6917305c3a5b42319348bc3f9b80e6f3",
"00fcb86b1ad345dfa99cfe360f19ae2f",
"85107cd3d5cb4395b91f4058c622fa60"
]
},
"id": "SQQeD8bCRX-r",
"outputId": "dd937555-575a-40d3-85a3-c7e7188679a6"
},
"source": [
"# VIVOS\n",
"results_vivos = test_dataset_vivos.map(map_to_result)\n",
"print(\"Test WER: {:.5f}\".format(wer_metric.compute(predictions=results_vivos[\"pred_str\"], references=results_vivos[\"target_text\"])))\n",
"print(\"Test WER: {:.5f}\".format(wer_metric.compute(predictions=results_vivos[\"pred_str_beam\"], references=results_vivos[\"target_text\"])))"
],
"execution_count": null,
"outputs": [
{
"output_type": "display_data",
"data": {
"application/vnd.jupyter.widget-view+json": {
"model_id": "bab8f7dfa1cb433eb2590607d00d145a",
"version_minor": 0,
"version_major": 2
},
"text/plain": [
" 0%| | 0/760 [00:00<?, ?ex/s]"
]
},
"metadata": {}
},
{
"output_type": "stream",
"text": [
"Test WER: 0.10774\n",
"Test WER: 0.06151\n"
],
"name": "stdout"
}
]
},
{
"cell_type": "code",
"metadata": {
"id": "-V_Fw-wMU6Qp",
"colab": {
"base_uri": "https://localhost:8080/",
"height": 83,
"referenced_widgets": [
"7dcf5b66b2f848cdb928159949f04456",
"4500810e43c4427e9a75088ada21da60",
"0360ada0de32460aa2553f864ab1cd0c",
"43689d3c564740f3a79840ce18f92191",
"b2cc394b769d4589b4f3b9f7628a7c8a",
"7a68cb2c83e44d6ca7274f279206c031",
"8ce407354781435381275d9e9cddb29d",
"324ed59451164031b302e9cd9c307f4c",
"99a5624850814ed2888a8a72f84a5fb6",
"ae53136477984344bbd5fcb7d95da149",
"8ff64fafd5174346bc60ae7554f592b5"
]
},
"outputId": "188f7e90-fda5-4c13-cbe8-eea39e4c7448"
},
"source": [
"# T1\n",
"results_t1 = test_dataset_t1.map(map_to_result)\n",
"print(\"Test WER: {:.3f}\".format(wer_metric.compute(predictions=results_t1[\"pred_str\"], references=results_t1[\"target_text\"])))\n",
"print(\"Test WER: {:.3f}\".format(wer_metric.compute(predictions=results_t1[\"pred_str_beam\"], references=results_t1[\"target_text\"])))"
],
"execution_count": null,
"outputs": [
{
"output_type": "display_data",
"data": {
"application/vnd.jupyter.widget-view+json": {
"model_id": "7dcf5b66b2f848cdb928159949f04456",
"version_minor": 0,
"version_major": 2
},
"text/plain": [
" 0%| | 0/7072 [00:00<?, ?ex/s]"
]
},
"metadata": {}
},
{
"output_type": "stream",
"text": [
"Test WER: 0.133\n",
"Test WER: 0.091\n"
],
"name": "stdout"
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 83,
"referenced_widgets": [
"e85fbd4338a94e86a3d493eaf4ef4534",
"5c844cb17bc64aeb810e530d551c9c3c",
"eaf60db5de2f4e819a5d300f2a0427d0",
"b8fc694cf5e74da9a7a56b3ec5273aee",
"7e7711ca5836422497af65cb8ace9d75",
"a58fc6870d9f4e42a9a522ab59d946f5",
"affc0c5dd7d444c8b15a7a1986894554",
"34b30414c8c34df88bb9bfc30184b872",
"0ec3d5c2b54945b18cfd8924f0b6d6b4",
"b14c32833fca4f948ab3270af2c3248f",
"9c160e343f9245ba917f0e96fa2fb437"
]
},
"id": "itBLJVazAEK9",
"outputId": "96679855-bca1-47e6-f1e8-fb0e4580331c"
},
"source": [
"# T2\n",
"results_t2 = test_dataset_t2.map(map_to_result)\n",
"print(\"Test WER: {:.3f}\".format(wer_metric.compute(predictions=results_t2[\"pred_str\"], references=results_t2[\"target_text\"])))\n",
"print(\"Test WER: {:.3f}\".format(wer_metric.compute(predictions=results_t2[\"pred_str_beam\"], references=results_t2[\"target_text\"])))"
],
"execution_count": null,
"outputs": [
{
"output_type": "display_data",
"data": {
"application/vnd.jupyter.widget-view+json": {
"model_id": "e85fbd4338a94e86a3d493eaf4ef4534",
"version_minor": 0,
"version_major": 2
},
"text/plain": [
" 0%| | 0/18788 [00:00<?, ?ex/s]"
]
},
"metadata": {}
},
{
"output_type": "stream",
"text": [
"Test WER: 0.514\n",
"Test WER: 0.408\n"
],
"name": "stdout"
}
]
},
{
"cell_type": "markdown",
"metadata": {
"id": "IQQQhKrTogz3"
},
"source": [
"# Split long audio"
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/"
},
"id": "hNZ8y4s3okKr",
"outputId": "da682524-a017-4b08-f7a5-71b26dc0ea82"
},
"source": [
"# https://pytorch.org/hub/snakers4_silero-vad_vad/\n",
"import torch\n",
"import onnxruntime\n",
"from pprint import pprint\n",
"from pydub import AudioSegment\n",
"\n",
"_, utils = torch.hub.load(repo_or_dir='snakers4/silero-vad',\n",
" model='silero_vad',\n",
" force_reload=True)\n",
"\n",
"(get_speech_ts,\n",
" get_speech_ts_adaptive,\n",
" _, read_audio,\n",
" _, _, _) = utils\n",
"files_dir = torch.hub.get_dir() + '/snakers4_silero-vad_master/files'\n",
"def init_onnx_model(model_path: str):\n",
" return onnxruntime.InferenceSession(model_path)\n",
"\n",
"def validate_onnx(model, inputs):\n",
" with torch.no_grad():\n",
" ort_inputs = {'input': inputs.cpu().numpy()}\n",
" outs = model.run(None, ort_inputs)\n",
" outs = [torch.Tensor(x) for x in outs]\n",
" return outs[0]\n",
"\n",
"model = init_onnx_model(f'{files_dir}/model.onnx')\n",
"\n",
"def long_speech_file_to_array_fn(path, max_seconds=5):\n",
" input_audio_path = path\n",
" if input_audio_path.endswith('m4a'):\n",
" track = AudioSegment.from_file(input_audio_path,'m4a')\n",
" input_audio_path_extentions = input_audio_path.split('.')[-1]\n",
" input_audio_path = input_audio_path.replace(input_audio_path_extentions, 'wav')\n",
" print(input_audio_path)\n",
" # input_audio_path = '/content/test.wav'\n",
" track.export(input_audio_path, format='wav')\n",
" batch = {\"file\": input_audio_path}\n",
" speech_array, sampling_rate = torchaudio.load(batch[\"file\"])\n",
" if sampling_rate != 16000:\n",
" transform = torchaudio.transforms.Resample(orig_freq=sampling_rate,\n",
" new_freq=16000)\n",
" speech_array = transform(speech_array)\n",
" speech_array = speech_array[0]\n",
" # split long audio by VAD\n",
" if max_seconds*16000 < len(speech_array):\n",
" print(\"split long audio by VAD\", max_seconds*16000, len(speech_array))\n",
" chunks = get_speech_ts(speech_array, model, \n",
" # trig_sum=0.5, \n",
" # neg_trig_sum=0.45, \n",
" num_steps=4,\n",
" # visualize_probs=False, \n",
" run_function=validate_onnx, \n",
" min_speech_samples=10000, \n",
" # min_silence_samples=0,\n",
" # smoothed_prob_func='mean',\n",
" )\n",
" else:\n",
" # print(\"No split long audio by VAD\")\n",
" chunks = [{'end': len(speech_array), 'start': 0}]\n",
" speech_array = speech_array.numpy()\n",
" batches = []\n",
" for chunk in chunks:\n",
" batches.append({\n",
" \"speech\": speech_array[chunk['start']: chunk['end']],\n",
" \"sampling_rate\": 16000\n",
" })\n",
" return batches"
],
"execution_count": null,
"outputs": [
{
"output_type": "stream",
"text": [
"Downloading: \"https://github.com/snakers4/silero-vad/archive/master.zip\" to /root/.cache/torch/hub/master.zip\n"
],
"name": "stderr"
}
]
},
{
"cell_type": "markdown",
"metadata": {
"id": "XCmXrTNV5Na7"
},
"source": [
"# Interaction test"
]
},
{
"cell_type": "code",
"metadata": {
"id": "1_ECevWx9pXH",
"colab": {
"resources": {
"http://localhost:8080/nbextensions/google.colab/files.js": {
"data": "Ly8gQ29weXJpZ2h0IDIwMTcgR29vZ2xlIExMQwovLwovLyBMaWNlbnNlZCB1bmRlciB0aGUgQXBhY2hlIExpY2Vuc2UsIFZlcnNpb24gMi4wICh0aGUgIkxpY2Vuc2UiKTsKLy8geW91IG1heSBub3QgdXNlIHRoaXMgZmlsZSBleGNlcHQgaW4gY29tcGxpYW5jZSB3aXRoIHRoZSBMaWNlbnNlLgovLyBZb3UgbWF5IG9idGFpbiBhIGNvcHkgb2YgdGhlIExpY2Vuc2UgYXQKLy8KLy8gICAgICBodHRwOi8vd3d3LmFwYWNoZS5vcmcvbGljZW5zZXMvTElDRU5TRS0yLjAKLy8KLy8gVW5sZXNzIHJlcXVpcmVkIGJ5IGFwcGxpY2FibGUgbGF3IG9yIGFncmVlZCB0byBpbiB3cml0aW5nLCBzb2Z0d2FyZQovLyBkaXN0cmlidXRlZCB1bmRlciB0aGUgTGljZW5zZSBpcyBkaXN0cmlidXRlZCBvbiBhbiAiQVMgSVMiIEJBU0lTLAovLyBXSVRIT1VUIFdBUlJBTlRJRVMgT1IgQ09ORElUSU9OUyBPRiBBTlkgS0lORCwgZWl0aGVyIGV4cHJlc3Mgb3IgaW1wbGllZC4KLy8gU2VlIHRoZSBMaWNlbnNlIGZvciB0aGUgc3BlY2lmaWMgbGFuZ3VhZ2UgZ292ZXJuaW5nIHBlcm1pc3Npb25zIGFuZAovLyBsaW1pdGF0aW9ucyB1bmRlciB0aGUgTGljZW5zZS4KCi8qKgogKiBAZmlsZW92ZXJ2aWV3IEhlbHBlcnMgZm9yIGdvb2dsZS5jb2xhYiBQeXRob24gbW9kdWxlLgogKi8KKGZ1bmN0aW9uKHNjb3BlKSB7CmZ1bmN0aW9uIHNwYW4odGV4dCwgc3R5bGVBdHRyaWJ1dGVzID0ge30pIHsKICBjb25zdCBlbGVtZW50ID0gZG9jdW1lbnQuY3JlYXRlRWxlbWVudCgnc3BhbicpOwogIGVsZW1lbnQudGV4dENvbnRlbnQgPSB0ZXh0OwogIGZvciAoY29uc3Qga2V5IG9mIE9iamVjdC5rZXlzKHN0eWxlQXR0cmlidXRlcykpIHsKICAgIGVsZW1lbnQuc3R5bGVba2V5XSA9IHN0eWxlQXR0cmlidXRlc1trZXldOwogIH0KICByZXR1cm4gZWxlbWVudDsKfQoKLy8gTWF4IG51bWJlciBvZiBieXRlcyB3aGljaCB3aWxsIGJlIHVwbG9hZGVkIGF0IGEgdGltZS4KY29uc3QgTUFYX1BBWUxPQURfU0laRSA9IDEwMCAqIDEwMjQ7CgpmdW5jdGlvbiBfdXBsb2FkRmlsZXMoaW5wdXRJZCwgb3V0cHV0SWQpIHsKICBjb25zdCBzdGVwcyA9IHVwbG9hZEZpbGVzU3RlcChpbnB1dElkLCBvdXRwdXRJZCk7CiAgY29uc3Qgb3V0cHV0RWxlbWVudCA9IGRvY3VtZW50LmdldEVsZW1lbnRCeUlkKG91dHB1dElkKTsKICAvLyBDYWNoZSBzdGVwcyBvbiB0aGUgb3V0cHV0RWxlbWVudCB0byBtYWtlIGl0IGF2YWlsYWJsZSBmb3IgdGhlIG5leHQgY2FsbAogIC8vIHRvIHVwbG9hZEZpbGVzQ29udGludWUgZnJvbSBQeXRob24uCiAgb3V0cHV0RWxlbWVudC5zdGVwcyA9IHN0ZXBzOwoKICByZXR1cm4gX3VwbG9hZEZpbGVzQ29udGludWUob3V0cHV0SWQpOwp9CgovLyBUaGlzIGlzIHJvdWdobHkgYW4gYXN5bmMgZ2VuZXJhdG9yIChub3Qgc3VwcG9ydGVkIGluIHRoZSBicm93c2VyIHlldCksCi8vIHdoZXJlIHRoZXJlIGFyZSBtdWx0aXBsZSBhc3luY2hyb25vdXMgc3RlcHMgYW5kIHRoZSBQeXRob24gc2lkZSBpcyBnb2luZwovLyB0byBwb2xsIGZvciBjb21wbGV0aW9uIG9mIGVhY2ggc3RlcC4KLy8gVGhpcyB1c2VzIGEgUHJvbWlzZSB0byBibG9jayB0aGUgcHl0aG9uIHNpZGUgb24gY29tcGxldGlvbiBvZiBlYWNoIHN0ZXAsCi8vIHRoZW4gcGFzc2VzIHRoZSByZXN1bHQgb2YgdGhlIHByZXZpb3VzIHN0ZXAgYXMgdGhlIGlucHV0IHRvIHRoZSBuZXh0IHN0ZXAuCmZ1bmN0aW9uIF91cGxvYWRGaWxlc0NvbnRpbnVlKG91dHB1dElkKSB7CiAgY29uc3Qgb3V0cHV0RWxlbWVudCA9IGRvY3VtZW50LmdldEVsZW1lbnRCeUlkKG91dHB1dElkKTsKICBjb25zdCBzdGVwcyA9IG91dHB1dEVsZW1lbnQuc3RlcHM7CgogIGNvbnN0IG5leHQgPSBzdGVwcy5uZXh0KG91dHB1dEVsZW1lbnQubGFzdFByb21pc2VWYWx1ZSk7CiAgcmV0dXJuIFByb21pc2UucmVzb2x2ZShuZXh0LnZhbHVlLnByb21pc2UpLnRoZW4oKHZhbHVlKSA9PiB7CiAgICAvLyBDYWNoZSB0aGUgbGFzdCBwcm9taXNlIHZhbHVlIHRvIG1ha2UgaXQgYXZhaWxhYmxlIHRvIHRoZSBuZXh0CiAgICAvLyBzdGVwIG9mIHRoZSBnZW5lcmF0b3IuCiAgICBvdXRwdXRFbGVtZW50Lmxhc3RQcm9taXNlVmFsdWUgPSB2YWx1ZTsKICAgIHJldHVybiBuZXh0LnZhbHVlLnJlc3BvbnNlOwogIH0pOwp9CgovKioKICogR2VuZXJhdG9yIGZ1bmN0aW9uIHdoaWNoIGlzIGNhbGxlZCBiZXR3ZWVuIGVhY2ggYXN5bmMgc3RlcCBvZiB0aGUgdXBsb2FkCiAqIHByb2Nlc3MuCiAqIEBwYXJhbSB7c3RyaW5nfSBpbnB1dElkIEVsZW1lbnQgSUQgb2YgdGhlIGlucHV0IGZpbGUgcGlja2VyIGVsZW1lbnQuCiAqIEBwYXJhbSB7c3RyaW5nfSBvdXRwdXRJZCBFbGVtZW50IElEIG9mIHRoZSBvdXRwdXQgZGlzcGxheS4KICogQHJldHVybiB7IUl0ZXJhYmxlPCFPYmplY3Q+fSBJdGVyYWJsZSBvZiBuZXh0IHN0ZXBzLgogKi8KZnVuY3Rpb24qIHVwbG9hZEZpbGVzU3RlcChpbnB1dElkLCBvdXRwdXRJZCkgewogIGNvbnN0IGlucHV0RWxlbWVudCA9IGRvY3VtZW50LmdldEVsZW1lbnRCeUlkKGlucHV0SWQpOwogIGlucHV0RWxlbWVudC5kaXNhYmxlZCA9IGZhbHNlOwoKICBjb25zdCBvdXRwdXRFbGVtZW50ID0gZG9jdW1lbnQuZ2V0RWxlbWVudEJ5SWQob3V0cHV0SWQpOwogIG91dHB1dEVsZW1lbnQuaW5uZXJIVE1MID0gJyc7CgogIGNvbnN0IHBpY2tlZFByb21pc2UgPSBuZXcgUHJvbWlzZSgocmVzb2x2ZSkgPT4gewogICAgaW5wdXRFbGVtZW50LmFkZEV2ZW50TGlzdGVuZXIoJ2NoYW5nZScsIChlKSA9PiB7CiAgICAgIHJlc29sdmUoZS50YXJnZXQuZmlsZXMpOwogICAgfSk7CiAgfSk7CgogIGNvbnN0IGNhbmNlbCA9IGRvY3VtZW50LmNyZWF0ZUVsZW1lbnQoJ2J1dHRvbicpOwogIGlucHV0RWxlbWVudC5wYXJlbnRFbGVtZW50LmFwcGVuZENoaWxkKGNhbmNlbCk7CiAgY2FuY2VsLnRleHRDb250ZW50ID0gJ0NhbmNlbCB1cGxvYWQnOwogIGNvbnN0IGNhbmNlbFByb21pc2UgPSBuZXcgUHJvbWlzZSgocmVzb2x2ZSkgPT4gewogICAgY2FuY2VsLm9uY2xpY2sgPSAoKSA9PiB7CiAgICAgIHJlc29sdmUobnVsbCk7CiAgICB9OwogIH0pOwoKICAvLyBXYWl0IGZvciB0aGUgdXNlciB0byBwaWNrIHRoZSBmaWxlcy4KICBjb25zdCBmaWxlcyA9IHlpZWxkIHsKICAgIHByb21pc2U6IFByb21pc2UucmFjZShbcGlja2VkUHJvbWlzZSwgY2FuY2VsUHJvbWlzZV0pLAogICAgcmVzcG9uc2U6IHsKICAgICAgYWN0aW9uOiAnc3RhcnRpbmcnLAogICAgfQogIH07CgogIGNhbmNlbC5yZW1vdmUoKTsKCiAgLy8gRGlzYWJsZSB0aGUgaW5wdXQgZWxlbWVudCBzaW5jZSBmdXJ0aGVyIHBpY2tzIGFyZSBub3QgYWxsb3dlZC4KICBpbnB1dEVsZW1lbnQuZGlzYWJsZWQgPSB0cnVlOwoKICBpZiAoIWZpbGVzKSB7CiAgICByZXR1cm4gewogICAgICByZXNwb25zZTogewogICAgICAgIGFjdGlvbjogJ2NvbXBsZXRlJywKICAgICAgfQogICAgfTsKICB9CgogIGZvciAoY29uc3QgZmlsZSBvZiBmaWxlcykgewogICAgY29uc3QgbGkgPSBkb2N1bWVudC5jcmVhdGVFbGVtZW50KCdsaScpOwogICAgbGkuYXBwZW5kKHNwYW4oZmlsZS5uYW1lLCB7Zm9udFdlaWdodDogJ2JvbGQnfSkpOwogICAgbGkuYXBwZW5kKHNwYW4oCiAgICAgICAgYCgke2ZpbGUudHlwZSB8fCAnbi9hJ30pIC0gJHtmaWxlLnNpemV9IGJ5dGVzLCBgICsKICAgICAgICBgbGFzdCBtb2RpZmllZDogJHsKICAgICAgICAgICAgZmlsZS5sYXN0TW9kaWZpZWREYXRlID8gZmlsZS5sYXN0TW9kaWZpZWREYXRlLnRvTG9jYWxlRGF0ZVN0cmluZygpIDoKICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgICAgJ24vYSd9IC0gYCkpOwogICAgY29uc3QgcGVyY2VudCA9IHNwYW4oJzAlIGRvbmUnKTsKICAgIGxpLmFwcGVuZENoaWxkKHBlcmNlbnQpOwoKICAgIG91dHB1dEVsZW1lbnQuYXBwZW5kQ2hpbGQobGkpOwoKICAgIGNvbnN0IGZpbGVEYXRhUHJvbWlzZSA9IG5ldyBQcm9taXNlKChyZXNvbHZlKSA9PiB7CiAgICAgIGNvbnN0IHJlYWRlciA9IG5ldyBGaWxlUmVhZGVyKCk7CiAgICAgIHJlYWRlci5vbmxvYWQgPSAoZSkgPT4gewogICAgICAgIHJlc29sdmUoZS50YXJnZXQucmVzdWx0KTsKICAgICAgfTsKICAgICAgcmVhZGVyLnJlYWRBc0FycmF5QnVmZmVyKGZpbGUpOwogICAgfSk7CiAgICAvLyBXYWl0IGZvciB0aGUgZGF0YSB0byBiZSByZWFkeS4KICAgIGxldCBmaWxlRGF0YSA9IHlpZWxkIHsKICAgICAgcHJvbWlzZTogZmlsZURhdGFQcm9taXNlLAogICAgICByZXNwb25zZTogewogICAgICAgIGFjdGlvbjogJ2NvbnRpbnVlJywKICAgICAgfQogICAgfTsKCiAgICAvLyBVc2UgYSBjaHVua2VkIHNlbmRpbmcgdG8gYXZvaWQgbWVzc2FnZSBzaXplIGxpbWl0cy4gU2VlIGIvNjIxMTU2NjAuCiAgICBsZXQgcG9zaXRpb24gPSAwOwogICAgZG8gewogICAgICBjb25zdCBsZW5ndGggPSBNYXRoLm1pbihmaWxlRGF0YS5ieXRlTGVuZ3RoIC0gcG9zaXRpb24sIE1BWF9QQVlMT0FEX1NJWkUpOwogICAgICBjb25zdCBjaHVuayA9IG5ldyBVaW50OEFycmF5KGZpbGVEYXRhLCBwb3NpdGlvbiwgbGVuZ3RoKTsKICAgICAgcG9zaXRpb24gKz0gbGVuZ3RoOwoKICAgICAgY29uc3QgYmFzZTY0ID0gYnRvYShTdHJpbmcuZnJvbUNoYXJDb2RlLmFwcGx5KG51bGwsIGNodW5rKSk7CiAgICAgIHlpZWxkIHsKICAgICAgICByZXNwb25zZTogewogICAgICAgICAgYWN0aW9uOiAnYXBwZW5kJywKICAgICAgICAgIGZpbGU6IGZpbGUubmFtZSwKICAgICAgICAgIGRhdGE6IGJhc2U2NCwKICAgICAgICB9LAogICAgICB9OwoKICAgICAgbGV0IHBlcmNlbnREb25lID0gZmlsZURhdGEuYnl0ZUxlbmd0aCA9PT0gMCA/CiAgICAgICAgICAxMDAgOgogICAgICAgICAgTWF0aC5yb3VuZCgocG9zaXRpb24gLyBmaWxlRGF0YS5ieXRlTGVuZ3RoKSAqIDEwMCk7CiAgICAgIHBlcmNlbnQudGV4dENvbnRlbnQgPSBgJHtwZXJjZW50RG9uZX0lIGRvbmVgOwoKICAgIH0gd2hpbGUgKHBvc2l0aW9uIDwgZmlsZURhdGEuYnl0ZUxlbmd0aCk7CiAgfQoKICAvLyBBbGwgZG9uZS4KICB5aWVsZCB7CiAgICByZXNwb25zZTogewogICAgICBhY3Rpb246ICdjb21wbGV0ZScsCiAgICB9CiAgfTsKfQoKc2NvcGUuZ29vZ2xlID0gc2NvcGUuZ29vZ2xlIHx8IHt9OwpzY29wZS5nb29nbGUuY29sYWIgPSBzY29wZS5nb29nbGUuY29sYWIgfHwge307CnNjb3BlLmdvb2dsZS5jb2xhYi5fZmlsZXMgPSB7CiAgX3VwbG9hZEZpbGVzLAogIF91cGxvYWRGaWxlc0NvbnRpbnVlLAp9Owp9KShzZWxmKTsK",
"ok": true,
"headers": [
[
"content-type",
"application/javascript"
]
],
"status": 200,
"status_text": ""
}
},
"base_uri": "https://localhost:8080/",
"height": 215
},
"cellView": "form",
"outputId": "4e81b02f-b5f7-425a-ca78-7376f94bcc77"
},
"source": [
"#@markdown Either record audio from microphone or upload audio from file (.mp3 or .wav) { run: \"auto\" }\n",
"record_or_upload = \"Upload (.mp3 or .wav)\" #@param [\"Record\", \"Upload (.mp3 or .wav)\"]\n",
"record_seconds = 5#@param {type:\"number\", min:1, max:10, step:1}\n",
"sample_rate = 16000\n",
"\n",
"import ipywidgets as widgets\n",
"from scipy.io import wavfile\n",
"from IPython.display import Audio, display, clear_output\n",
"import io\n",
"import base64\n",
"import tempfile\n",
"from typing import Optional\n",
"from pydub import AudioSegment\n",
"from google.colab import files\n",
"from google.colab import output\n",
"from IPython import display as _display\n",
"import torchaudio\n",
"import numpy as np\n",
"import time\n",
"\n",
"def read_audio(path: str,\n",
" target_sr: int = 16000):\n",
"\n",
" wav, sr = torchaudio.load(path)\n",
"\n",
" if wav.size(0) > 1:\n",
" wav = wav.mean(dim=0, keepdim=True)\n",
"\n",
" if sr != target_sr:\n",
" transform = torchaudio.transforms.Resample(orig_freq=sr,\n",
" new_freq=target_sr)\n",
" wav = transform(wav)\n",
" sr = target_sr\n",
"\n",
" assert sr == target_sr\n",
" return wav.squeeze(0)\n",
"\n",
"def record_audio(seconds: int = 3,\n",
" normalize_db: float = 0.1):\n",
" # Use Javascript to record audio.\n",
" record_js_code = \"\"\"\n",
" const sleep = time => new Promise(resolve => setTimeout(resolve, time))\n",
" const b2text = blob => new Promise(resolve => {\n",
" const reader = new FileReader()\n",
" reader.onloadend = e => resolve(e.srcElement.result)\n",
" reader.readAsDataURL(blob)\n",
" })\n",
" var record = time => new Promise(async resolve => {\n",
" stream = await navigator.mediaDevices.getUserMedia({ audio: true })\n",
" recorder = new MediaRecorder(stream)\n",
" chunks = []\n",
" recorder.ondataavailable = e => chunks.push(e.data)\n",
" recorder.start()\n",
" await sleep(time)\n",
" recorder.onstop = async ()=>{\n",
" blob = new Blob(chunks)\n",
" text = await b2text(blob)\n",
" resolve(text)\n",
" }\n",
" recorder.stop()\n",
" })\n",
" \"\"\"\n",
" print('Starting recording for {} seconds...'.format(seconds))\n",
" _display.display(_display.Javascript(record_js_code))\n",
" audio_string = output.eval_js('record(%d)' % (seconds * 1000.0))\n",
" print('Finished recording!')\n",
" audio_bytes = base64.b64decode(audio_string.split(',')[1])\n",
" return audio_bytes_to_np(audio_bytes,\n",
" normalize_db=normalize_db)\n",
"\n",
"\n",
"def audio_bytes_to_np(wav_data: bytes,\n",
" normalize_db: float = 0.1):\n",
" # Parse and normalize the audio.\n",
" audio = AudioSegment.from_file(io.BytesIO(wav_data))\n",
" audio.remove_dc_offset()\n",
" if normalize_db is not None:\n",
" audio.normalize(headroom=normalize_db)\n",
" # Save to tempfile and load with librosa.\n",
" with tempfile.NamedTemporaryFile(suffix='.wav') as temp_wav_file:\n",
" fname = temp_wav_file.name\n",
" audio.export(fname, format='wav')\n",
" wav = read_audio(fname)\n",
" return wav\n",
"\n",
"\n",
"def upload_audio(normalize_db: Optional[float] = None):\n",
" audio_files = files.upload()\n",
" fnames = list(audio_files.keys())\n",
" if len(fnames) == 0:\n",
" return None\n",
" return read_audio(fnames[0])\n",
"\n",
"def wav_to_text():\n",
" input_batch = speech_file_to_array_fn('test.wav')\n",
" output = map_to_result(input_batch)\n",
" return output[\"pred_str_beam\"]\n",
"\n",
"def _recognize(audio):\n",
" display(Audio(audio, rate=sample_rate, autoplay=True))\n",
" # if use_VAD == \"Yes\":\n",
" # audio = _apply_vad(audio)\n",
" wavfile.write('test.wav', sample_rate, (32767*audio).numpy().astype(np.int16))\n",
" start_time = time.time()\n",
" transcription = wav_to_text()\n",
" print('\\n\\nTRANSCRIPTION in {:.3f}s:\\n'.format(time.time() - start_time))\n",
" print(transcription)\n",
"\n",
"def _record_audio(b):\n",
" clear_output()\n",
" audio = record_audio(record_seconds)\n",
" wavfile.write('recorded.wav', sample_rate, (32767*audio).numpy().astype(np.int16))\n",
" _recognize(audio)\n",
"\n",
"def _upload_audio(b):\n",
" clear_output()\n",
" audio = upload_audio()\n",
" _recognize(audio)\n",
" return audio\n",
"\n",
"\n",
"if record_or_upload == \"Record\":\n",
" button = widgets.Button(description=\"Record Speech\")\n",
" button.on_click(_record_audio)\n",
" display(button)\n",
"else:\n",
" audio = _upload_audio(\"\")"
],
"execution_count": null,
"outputs": [
{
"output_type": "display_data",
"data": {
"text/html": [
"\n",
" <input type=\"file\" id=\"files-9ef56e21-0140-4125-8b53-c30b61b47ea7\" name=\"files[]\" multiple disabled\n",
" style=\"border:none\" />\n",
" <output id=\"result-9ef56e21-0140-4125-8b53-c30b61b47ea7\">\n",
" Upload widget is only available when the cell has been executed in the\n",
" current browser session. Please rerun this cell to enable.\n",
" </output>\n",
" <script src=\"/nbextensions/google.colab/files.js\"></script> "
],
"text/plain": [
"<IPython.core.display.HTML object>"
]
},
"metadata": {}
},
{
"output_type": "stream",
"text": [
"Saving VIVOSDEV02_R106.wav to VIVOSDEV02_R106.wav\n"
],
"name": "stdout"
},
{
"output_type": "display_data",
"data": {
"text/html": [
"\n",
" <audio controls=\"controls\" autoplay=\"autoplay\">\n",
" <source src=\"data:audio/wav;base64,\" type=\"audio/wav\" />\n",
" Your browser does not support the audio element.\n",
" </audio>\n",
" "
],
"text/plain": [
"<IPython.lib.display.Audio object>"
]
},
"metadata": {}
},
{
"output_type": "stream",
"text": [
"\n",
"\n",
"TRANSCRIPTION in 0.034s:\n",
"\n",
"trở nên thụ động\n"
],
"name": "stdout"
}
]
},
{
"cell_type": "markdown",
"metadata": {
"id": "DApYGigghLdW"
},
"source": [
"# Web interface interaction test"
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 640
},
"id": "mrh38iWVhK7U",
"outputId": "ce594d7d-5959-42e3-c4c1-7b6feb655d15"
},
"source": [
"import gradio as gr\n",
"import time\n",
"def voicerec(aud):\n",
" # input_batch = speech_file_to_array_fn(aud.name, max_seconds=10)\n",
" input_batches = long_speech_file_to_array_fn(aud.name)\n",
" outputs = []\n",
" for input_batch in input_batches:\n",
" start_time = time.time()\n",
" output_result = map_to_result(input_batch)\n",
" outputs.append({\n",
" \"output\": output_result['pred_str_beam'],\n",
" # \"ctc_output\": output_result['pred_str'],\n",
" \"time_infer\": \"{:.5f}s\".format(time.time() - start_time)\n",
" })\n",
" return {\n",
" \"output\": \" \".join([item['output'] for item in outputs]), \n",
" \"shards\": outputs\n",
" }\n",
"input = gr.inputs.Audio(label=\"Input Audio\", type=\"file\") \n",
"output = gr.outputs.JSON(label=\"ASR result\")\n",
"\n",
"\n",
"title = \"Automatic Speech Recognition with Wav2vec\"\n",
"description = \"Upload audio file (<10s) then submit. \"\n",
"examples = [[]]\n",
"\n",
"gr.Interface(voicerec, input, output, title=title, description=description, examples=examples).launch()"
],
"execution_count": null,
"outputs": [
{
"output_type": "stream",
"text": [
"Colab notebook detected. To show errors in colab notebook, set `debug=True` in `launch()`\n",
"This share link will expire in 24 hours. If you need a permanent link, visit: https://gradio.app/introducing-hosted (NEW!)\n",
"Running on External URL: https://27576.gradio.app\n",
"Interface loading below...\n"
],
"name": "stdout"
},
{
"output_type": "display_data",
"data": {
"text/html": [
"\n",
" <iframe\n",
" width=\"900\"\n",
" height=\"500\"\n",
" src=\"https://27576.gradio.app\"\n",
" frameborder=\"0\"\n",
" allowfullscreen\n",
" ></iframe>\n",
" "
],
"text/plain": [
"<IPython.lib.display.IFrame at 0x7fc571966550>"
]
},
"metadata": {}
},
{
"output_type": "execute_result",
"data": {
"text/plain": [
"(<Flask 'gradio.networking'>,\n",
" 'http://127.0.0.1:7860/',\n",
" 'https://27576.gradio.app')"
]
},
"metadata": {},
"execution_count": 11
}
]
},
{
"cell_type": "markdown",
"metadata": {
"id": "DImR2W3826tU"
},
"source": [
"# Show eval samples"
]
},
{
"cell_type": "code",
"metadata": {
"id": "CrqE-RYr28eZ"
},
"source": [
"from datasets import ClassLabel\n",
"import random\n",
"import pandas as pd\n",
"from IPython.display import display, HTML\n",
"\n",
"def show_random_elements(dataset, columns, num_examples=10):\n",
" assert num_examples <= len(dataset), \"Can't pick more elements than there are in the dataset.\"\n",
" picks = []\n",
" for _ in range(num_examples):\n",
" pick = random.randint(0, len(dataset)-1)\n",
" while pick in picks:\n",
" pick = random.randint(0, len(dataset)-1)\n",
" picks.append(pick)\n",
" \n",
" df = pd.DataFrame(dataset[picks], columns=columns)\n",
" display(HTML(df.to_html()))"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 979
},
"id": "Nic-d32I7JLw",
"outputId": "f8adbf5c-26f3-437b-ac09-350b6435380a"
},
"source": [
"show_random_elements(results_common, columns=['target_text', 'pred_str_beam', 'pred_str'], num_examples=30)"
],
"execution_count": null,
"outputs": [
{
"output_type": "display_data",
"data": {
"text/html": [
"<table border=\"1\" class=\"dataframe\">\n",
" <thead>\n",
" <tr style=\"text-align: right;\">\n",
" <th></th>\n",
" <th>target_text</th>\n",
" <th>pred_str_beam</th>\n",
" <th>pred_str</th>\n",
" </tr>\n",
" </thead>\n",
" <tbody>\n",
" <tr>\n",
" <th>0</th>\n",
" <td>vậy mà quân vẫn lạnh lùng vô cảm</td>\n",
" <td>vậy mà quân vẫn lạnh lùng tôn cảm</td>\n",
" <td>vậy mà quân vẫn lạnh lùng tôn cảm</td>\n",
" </tr>\n",
" <tr>\n",
" <th>1</th>\n",
" <td>trái cây thơm trên miền đất khô cằn</td>\n",
" <td>trái cây thơm trên miền đất khô cằn</td>\n",
" <td>trái cây thơm trên miền đất khu cản</td>\n",
" </tr>\n",
" <tr>\n",
" <th>2</th>\n",
" <td>em run giọng nói</td>\n",
" <td>em hương giọng nói</td>\n",
" <td>em hương gọng nó</td>\n",
" </tr>\n",
" <tr>\n",
" <th>3</th>\n",
" <td>khi cô đơn cạn tình ai cũng thế</td>\n",
" <td>khi cô đơn cạnh trình ai cũng thấy nước</td>\n",
" <td>khi cô đơn cạnh trình ai cũng thấy nớ ất</td>\n",
" </tr>\n",
" <tr>\n",
" <th>4</th>\n",
" <td>tôi có cái ý như thế này</td>\n",
" <td>tôi có cái ý như thế này</td>\n",
" <td>tôi có cái ý như thế này</td>\n",
" </tr>\n",
" <tr>\n",
" <th>5</th>\n",
" <td>cô thu ngân lo lắng gọi</td>\n",
" <td>cô thương ngăn lo lắng gọi</td>\n",
" <td>cô thương ngăn lo lắng gọi</td>\n",
" </tr>\n",
" <tr>\n",
" <th>6</th>\n",
" <td>họp lớp sau nhiều năm mỗi người một nơi</td>\n",
" <td>họp lớp sau nhiều năm mỗi người một nơi</td>\n",
" <td>họp lớp sau nhiều năm mỗi người một nơi</td>\n",
" </tr>\n",
" <tr>\n",
" <th>7</th>\n",
" <td>em còn hẹn nữa không</td>\n",
" <td>em còn hẹn nữa không</td>\n",
" <td>em còn hẹ nữa không</td>\n",
" </tr>\n",
" <tr>\n",
" <th>8</th>\n",
" <td>anh chàng lái xe do vậy không thể nói tiếp điều đang muốn nói</td>\n",
" <td>anh chàng lái xe do vậy không thể nói tiết điều đang muốn nói</td>\n",
" <td>anh chàng lái xe do vậy không thể nói tiếc điều đang muốn nói</td>\n",
" </tr>\n",
" <tr>\n",
" <th>9</th>\n",
" <td>em cũng không có biết đâu</td>\n",
" <td>em cũng không có biết đâu</td>\n",
" <td>em cũng không có biết đâu</td>\n",
" </tr>\n",
" <tr>\n",
" <th>10</th>\n",
" <td>hắn đang đi lên đây</td>\n",
" <td>hắn đang đi lên đây</td>\n",
" <td>thắn đang đi lên đây</td>\n",
" </tr>\n",
" <tr>\n",
" <th>11</th>\n",
" <td>nó còn bảo là hôm nay nó muốn con đưa đi chơi cùng</td>\n",
" <td>nó còn bảo là hôm nay nó muốn con đưa đi chơi cùng</td>\n",
" <td>nó còn bảo là hôm nay nó muốn con đưa đi chơi cùng</td>\n",
" </tr>\n",
" <tr>\n",
" <th>12</th>\n",
" <td>nhà mới của em ở trong xóm</td>\n",
" <td>nhà mới của em ở trung sơn</td>\n",
" <td>nhà mới của em ở trùng sớm</td>\n",
" </tr>\n",
" <tr>\n",
" <th>13</th>\n",
" <td>nó cứ nhìn chằm chằm vào đó</td>\n",
" <td>nó cứ nhìn chằm chằm vào đó</td>\n",
" <td>nó cứ nhìn chằm crằm vào đó</td>\n",
" </tr>\n",
" <tr>\n",
" <th>14</th>\n",
" <td>anh chị chào mào</td>\n",
" <td>anh chị chào nào</td>\n",
" <td>anh chị chào nào</td>\n",
" </tr>\n",
" <tr>\n",
" <th>15</th>\n",
" <td>trời tháng mườimây vờn bay bảng lãng</td>\n",
" <td>trời tháng mười mây vờn bay bảng lạng</td>\n",
" <td>trời tháng mười mâ vờn bay bảng lạng</td>\n",
" </tr>\n",
" <tr>\n",
" <th>16</th>\n",
" <td>kẻ bất tài</td>\n",
" <td>kẻ bất tài</td>\n",
" <td>kẻ bất tài</td>\n",
" </tr>\n",
" <tr>\n",
" <th>17</th>\n",
" <td>nhưng đến thật bất ngờ</td>\n",
" <td>nhưng đến thật bất ngờ</td>\n",
" <td>nhưng đến thịt bất ngờ</td>\n",
" </tr>\n",
" <tr>\n",
" <th>18</th>\n",
" <td>bàn chân nào ở lại</td>\n",
" <td>bàn chân nào ở lại</td>\n",
" <td>bàn chân nào ở lại</td>\n",
" </tr>\n",
" <tr>\n",
" <th>19</th>\n",
" <td>đừng có chết đấy</td>\n",
" <td>đừng có chết đấy</td>\n",
" <td>đừng có chết đấy</td>\n",
" </tr>\n",
" <tr>\n",
" <th>20</th>\n",
" <td>tiếng nói lại vang lên rất khẽ chỉ đủ cho mình nghe</td>\n",
" <td>tiếng nói lại mang lên rất khẽ chỉ đụng cho mình he</td>\n",
" <td>tiếng nói lại bang lên rất gẽ chỉ đụng cho mình e</td>\n",
" </tr>\n",
" <tr>\n",
" <th>21</th>\n",
" <td>sao mày nói dù chuyện gì cũng xảy ra</td>\n",
" <td>sao mày nói dù chuyện gì cũng xảy ra</td>\n",
" <td>sao mày nói dù chuyện gì cũng xảy ra</td>\n",
" </tr>\n",
" <tr>\n",
" <th>22</th>\n",
" <td>tiếng chuông đồng hồ quả lắc vang lên</td>\n",
" <td>tiếng chuông đồng hồ quả lắc vang lên</td>\n",
" <td>tiếng chuông đồng hồ quả lắp vang lên</td>\n",
" </tr>\n",
" <tr>\n",
" <th>23</th>\n",
" <td>những chiếc lá trút xuống đời thật tội</td>\n",
" <td>những chiếc lá trút xuống đời thích tội</td>\n",
" <td>những chiếc lá trút xuống đời thích tội</td>\n",
" </tr>\n",
" <tr>\n",
" <th>24</th>\n",
" <td>các cô cậu đều là người ở dưới xuôi lên</td>\n",
" <td>các cô cậu đều là người ở dưới xuôi lên</td>\n",
" <td>các cô cậu đều là người ở dưới suôi nêm</td>\n",
" </tr>\n",
" <tr>\n",
" <th>25</th>\n",
" <td>tại quảng trường ba đình</td>\n",
" <td>tại quảng trường ba đình</td>\n",
" <td>tại quảng trường ba tỉnh</td>\n",
" </tr>\n",
" <tr>\n",
" <th>26</th>\n",
" <td>ai vậy</td>\n",
" <td>ai vậy</td>\n",
" <td>ai vậy</td>\n",
" </tr>\n",
" <tr>\n",
" <th>27</th>\n",
" <td>dạ bẩm thầy giờ đã muộn rồi à</td>\n",
" <td>giả bấm thầy giờ đã muộn rồi hàng</td>\n",
" <td>giả bẫm thầy giờ đã muộn rồi hàng</td>\n",
" </tr>\n",
" <tr>\n",
" <th>28</th>\n",
" <td>hà ni ngỡ rằng anh ta đóng kịch</td>\n",
" <td>hà ny ngờ rằng anh ta đóng kịch</td>\n",
" <td>hà ny ngớ rằng anh ta đóng kịch</td>\n",
" </tr>\n",
" <tr>\n",
" <th>29</th>\n",
" <td>đến bố mẹ còn chẳng nhận ra cháu ạ</td>\n",
" <td>đến bố mẹ còn chẳng nhận ra cháu</td>\n",
" <td>đến bố mẹ còn chẳng nhận ra cháu ả</td>\n",
" </tr>\n",
" </tbody>\n",
"</table>"
],
"text/plain": [
"<IPython.core.display.HTML object>"
]
},
"metadata": {}
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 1000
},
"id": "aLZ5StKj29WC",
"outputId": "f2007d41-707d-4f08-a5df-582e45b9017f"
},
"source": [
"show_random_elements(results_t2, columns=['id', 'target_text', 'pred_str_beam', 'pred_str'], num_examples=30)"
],
"execution_count": null,
"outputs": [
{
"output_type": "display_data",
"data": {
"text/html": [
"<table border=\"1\" class=\"dataframe\">\n",
" <thead>\n",
" <tr style=\"text-align: right;\">\n",
" <th></th>\n",
" <th>id</th>\n",
" <th>target_text</th>\n",
" <th>pred_str_beam</th>\n",
" <th>pred_str</th>\n",
" </tr>\n",
" </thead>\n",
" <tbody>\n",
" <tr>\n",
" <th>0</th>\n",
" <td>0000013121</td>\n",
" <td>to lên</td>\n",
" <td>to lên</td>\n",
" <td>bo lên</td>\n",
" </tr>\n",
" <tr>\n",
" <th>1</th>\n",
" <td>0000005934</td>\n",
" <td>tăng âm lượng</td>\n",
" <td>tăng âm lượng</td>\n",
" <td>tăng âm lượng</td>\n",
" </tr>\n",
" <tr>\n",
" <th>2</th>\n",
" <td>0000013396</td>\n",
" <td>tiếng tắt</td>\n",
" <td>điện cực</td>\n",
" <td>điện cức</td>\n",
" </tr>\n",
" <tr>\n",
" <th>3</th>\n",
" <td>0000013523</td>\n",
" <td>kênh giảm</td>\n",
" <td>canh giờ</td>\n",
" <td>tanh gờ</td>\n",
" </tr>\n",
" <tr>\n",
" <th>4</th>\n",
" <td>0000003248</td>\n",
" <td>ti vi âm lượng tăng</td>\n",
" <td>bị âm lượng tăng</td>\n",
" <td>ti bị âm lợn tăng</td>\n",
" </tr>\n",
" <tr>\n",
" <th>5</th>\n",
" <td>0000002915</td>\n",
" <td>quạt số hai</td>\n",
" <td>và số hai</td>\n",
" <td>vạ số hai</td>\n",
" </tr>\n",
" <tr>\n",
" <th>6</th>\n",
" <td>0000010018</td>\n",
" <td>tắt đèn</td>\n",
" <td>rất đàn</td>\n",
" <td>rất đèn</td>\n",
" </tr>\n",
" <tr>\n",
" <th>7</th>\n",
" <td>0000008358</td>\n",
" <td>giảm</td>\n",
" <td>gam</td>\n",
" <td>gam</td>\n",
" </tr>\n",
" <tr>\n",
" <th>8</th>\n",
" <td>0000004603</td>\n",
" <td>ti vi tiếng tắt</td>\n",
" <td>ti vi tiếng tắt</td>\n",
" <td>ti vi tiếng tắt</td>\n",
" </tr>\n",
" <tr>\n",
" <th>9</th>\n",
" <td>0000010394</td>\n",
" <td>kênh giảm</td>\n",
" <td>cảnh sát</td>\n",
" <td>canh xá</td>\n",
" </tr>\n",
" <tr>\n",
" <th>10</th>\n",
" <td>0000015809</td>\n",
" <td>giảm đi</td>\n",
" <td>giảm đi</td>\n",
" <td>giảm đi</td>\n",
" </tr>\n",
" <tr>\n",
" <th>11</th>\n",
" <td>0000009877</td>\n",
" <td>bật điều hòa</td>\n",
" <td>bật điều hòa</td>\n",
" <td>bật điều hòa</td>\n",
" </tr>\n",
" <tr>\n",
" <th>12</th>\n",
" <td>0000006682</td>\n",
" <td>âm lượng ti vi giảm</td>\n",
" <td>âm lượng ti vi giảm</td>\n",
" <td>âm lượng ti vi gản</td>\n",
" </tr>\n",
" <tr>\n",
" <th>13</th>\n",
" <td>0000014050</td>\n",
" <td>điều hòa tắt</td>\n",
" <td>chiều hòa tấp</td>\n",
" <td>chều hòa tấp</td>\n",
" </tr>\n",
" <tr>\n",
" <th>14</th>\n",
" <td>0000018323</td>\n",
" <td>nên em hay trách chuyện của em nói đang để trong lòng bạn nói với chị họ của em á là phước yêu cầu những những cái đề nghị để cho bạn em sửa chữa đó thì bạn em làm không được</td>\n",
" <td>em hay trách chuyện của em nói bạn để trong lòng bạn nói với chị họ của em á là phước yêu cầu những những cái đề nghị để cho bạn em sửa chữa đó thì bạn em làm không được</td>\n",
" <td>em hay chách chuyện của em nói bạng đợ trong lòng bạn nói với chị họ của em á là phước yêu cầu những những cái đề nghị để cho bạn em sửa chữa đó thì bạn e làm không được</td>\n",
" </tr>\n",
" <tr>\n",
" <th>15</th>\n",
" <td>0000004087</td>\n",
" <td>bật quạt</td>\n",
" <td>bách quan</td>\n",
" <td>bệch quan</td>\n",
" </tr>\n",
" <tr>\n",
" <th>16</th>\n",
" <td>0000006444</td>\n",
" <td>tắt đèn đi</td>\n",
" <td>bắt bẻ đi</td>\n",
" <td>bát bè đi</td>\n",
" </tr>\n",
" <tr>\n",
" <th>17</th>\n",
" <td>0000017016</td>\n",
" <td>đèn bật</td>\n",
" <td>đèn bật</td>\n",
" <td>đèn mật</td>\n",
" </tr>\n",
" <tr>\n",
" <th>18</th>\n",
" <td>0000015131</td>\n",
" <td>nhỏ quạt đi</td>\n",
" <td>quá đi</td>\n",
" <td>nà qá đi</td>\n",
" </tr>\n",
" <tr>\n",
" <th>19</th>\n",
" <td>0000004101</td>\n",
" <td>giảm quạt đi</td>\n",
" <td>dạng quạt đi</td>\n",
" <td>dạng quạt đi</td>\n",
" </tr>\n",
" <tr>\n",
" <th>20</th>\n",
" <td>0000004046</td>\n",
" <td>nhỏ đi</td>\n",
" <td>nhỏ đi</td>\n",
" <td>nhỏ đi</td>\n",
" </tr>\n",
" <tr>\n",
" <th>21</th>\n",
" <td>0000009302</td>\n",
" <td>bật quạt</td>\n",
" <td>bật quạt</td>\n",
" <td>bật quảc</td>\n",
" </tr>\n",
" <tr>\n",
" <th>22</th>\n",
" <td>0000002419</td>\n",
" <td>tắt đèn</td>\n",
" <td>áp đen</td>\n",
" <td>áp đèn</td>\n",
" </tr>\n",
" <tr>\n",
" <th>23</th>\n",
" <td>0000017902</td>\n",
" <td>nhỏ</td>\n",
" <td></td>\n",
" <td>i</td>\n",
" </tr>\n",
" <tr>\n",
" <th>24</th>\n",
" <td>0000006992</td>\n",
" <td>bật âm ti vi</td>\n",
" <td>bật âm ti vi</td>\n",
" <td>bặt ân thi vi</td>\n",
" </tr>\n",
" <tr>\n",
" <th>25</th>\n",
" <td>0000017501</td>\n",
" <td>quạt tăng lên</td>\n",
" <td>và tăng ni</td>\n",
" <td>vàt thăng hy</td>\n",
" </tr>\n",
" <tr>\n",
" <th>26</th>\n",
" <td>0000013968</td>\n",
" <td>ti vi kênh giảm</td>\n",
" <td>ti vi kênh giảm</td>\n",
" <td>tivi cênh gậm</td>\n",
" </tr>\n",
" <tr>\n",
" <th>27</th>\n",
" <td>0000009720</td>\n",
" <td>tắt đèn</td>\n",
" <td>tác càng</td>\n",
" <td>tác càn</td>\n",
" </tr>\n",
" <tr>\n",
" <th>28</th>\n",
" <td>0000001798</td>\n",
" <td>nhỏ</td>\n",
" <td>nhờ</td>\n",
" <td>nhà</td>\n",
" </tr>\n",
" <tr>\n",
" <th>29</th>\n",
" <td>0000008827</td>\n",
" <td>đèn tắt đi</td>\n",
" <td>đèn tắt đi</td>\n",
" <td>đen tắt đi</td>\n",
" </tr>\n",
" </tbody>\n",
"</table>"
],
"text/plain": [
"<IPython.core.display.HTML object>"
]
},
"metadata": {}
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 1000
},
"id": "lvVfUgXh3D4a",
"outputId": "a644777e-e877-4d3c-dcbe-d0f31abfb73d"
},
"source": [
"show_random_elements(results_t1, columns=['id', 'target_text', 'pred_str_beam', 'pred_str'], num_examples=30)"
],
"execution_count": null,
"outputs": [
{
"output_type": "display_data",
"data": {
"text/html": [
"<table border=\"1\" class=\"dataframe\">\n",
" <thead>\n",
" <tr style=\"text-align: right;\">\n",
" <th></th>\n",
" <th>id</th>\n",
" <th>target_text</th>\n",
" <th>pred_str_beam</th>\n",
" <th>pred_str</th>\n",
" </tr>\n",
" </thead>\n",
" <tbody>\n",
" <tr>\n",
" <th>0</th>\n",
" <td>program-0014-00222</td>\n",
" <td>à vâng thưa nhà biên kịch trịnh thanh nhã ờ</td>\n",
" <td>ờ vâng thôi nhà biên kịch trịnh thanh nhã à</td>\n",
" <td>ờ vâng thơ nhà biên kịch trịnh thanh nhã ờ</td>\n",
" </tr>\n",
" <tr>\n",
" <th>1</th>\n",
" <td>program-0019-00392</td>\n",
" <td>không sao đâu ạ mẹ cứ ngủ thế đi không sao</td>\n",
" <td>không sao đâu ạ mẹ cứ ngủ thế đi không sao</td>\n",
" <td>không sao đâu ạ mẹ cứ ngủ thế đi công sao</td>\n",
" </tr>\n",
" <tr>\n",
" <th>2</th>\n",
" <td>program-0079-00113</td>\n",
" <td>nó không có cái gì thú vị hết tuấn kiệt thì em nghĩ là ừm em đánh giá gì về bồ độ em đang mặc</td>\n",
" <td>nó không có cái gì thú vị hết ấn kiệt thì em nghĩ là em đánh giá gì về bộ đồ em đang mặc</td>\n",
" <td>nó không có cái gì thú vị hết ấn kiệt thì em nghĩ là em đánh giá gì về bồ đồm em đăng mặt</td>\n",
" </tr>\n",
" <tr>\n",
" <th>3</th>\n",
" <td>program-0021-00224</td>\n",
" <td>làm trò để trêu các bạn cười rồi bắt lên hít đất</td>\n",
" <td>làm trò để trêu các bạn cười rồi vắt lên hít đất</td>\n",
" <td>làm trò để trêo các bạn cười rồi vắt lên thích đất</td>\n",
" </tr>\n",
" <tr>\n",
" <th>4</th>\n",
" <td>spk20h-000006-utt000000074</td>\n",
" <td>con cũng chưa tính ạ</td>\n",
" <td>quang cũng chưa tính ạ</td>\n",
" <td>qăng cũng chưa tính ạ</td>\n",
" </tr>\n",
" <tr>\n",
" <th>5</th>\n",
" <td>program-0015-00318</td>\n",
" <td>thưa quý vị và các bạn tôi đang cầm trên tay thanh sắt thông thường và vật liệu</td>\n",
" <td>thưa quý vị và các bạn tôi đang cầm trên tay thanh sắt thông thường và vật</td>\n",
" <td>thưa quý vị và các bạn tôi đang cầm trên tay thanh sắt không thường và vật</td>\n",
" </tr>\n",
" <tr>\n",
" <th>6</th>\n",
" <td>program-0074-00195</td>\n",
" <td>à cái người bán hàng họ phát hiện ra mình là người chụp chợ họ xin chụp chung với mình</td>\n",
" <td>cái người bán hàng họ phát hiện ra mình mọi người chụp chợ hình chụp chung với mình</td>\n",
" <td>cái người bán hàng họ phát hiện ra mình mọi người chục chợ sình chụp chung với mình</td>\n",
" </tr>\n",
" <tr>\n",
" <th>7</th>\n",
" <td>program-0115-00262</td>\n",
" <td>nhận ra rằng thất bại không phải là bức tường cao khó vượt qua đến thế</td>\n",
" <td>nhận ra rằng thất bại không phải là bức tượng cao khó vượt qua đến thế</td>\n",
" <td>nhận ra rằng thất bại không phải là bức tượng cao khó vượt qua đếm thê</td>\n",
" </tr>\n",
" <tr>\n",
" <th>8</th>\n",
" <td>spk20h-000044-utt000000042</td>\n",
" <td>những nơi đã khống chế được căn bệnh</td>\n",
" <td>những nơi đã khống chế được căn bệnh</td>\n",
" <td>những nơi đã không chế được căn bệnh</td>\n",
" </tr>\n",
" <tr>\n",
" <th>9</th>\n",
" <td>program-0033-00463</td>\n",
" <td>mọi người sẽ bị nhàm chán là trong cái việc là em á</td>\n",
" <td>mọi người sẽ bị nhàm chán là trong cái việc mà em</td>\n",
" <td>mọi người sẽ bị nhàm trán là trong cái việc là em</td>\n",
" </tr>\n",
" <tr>\n",
" <th>10</th>\n",
" <td>program-0021-00140</td>\n",
" <td>không hề có kiến thức về bóng đá mà lại lên bình luận bàn luận về bóng đá thì đó là một điều</td>\n",
" <td>không hề có kiến thức về bóng đá mà lại lên bình luận bàn luận về bóng đá thì đó là điều</td>\n",
" <td>không hề có kiến thức về bóng đá mà lại lên bình luận vàng luận về bóng đá thì đó là điều</td>\n",
" </tr>\n",
" <tr>\n",
" <th>11</th>\n",
" <td>program-0105-00302</td>\n",
" <td>lớp chỉ là cái cớ để nó khoe mẽ thôi</td>\n",
" <td>lớp chỉ là cái cớ để nó khoe mẽ thôi</td>\n",
" <td>lớp chỉ là cái cưới để nó khoe mẻ thôi</td>\n",
" </tr>\n",
" <tr>\n",
" <th>12</th>\n",
" <td>program-0147-00533</td>\n",
" <td>và trường hợp mà lừa tiền không biết là bao nhiêu lần để mà kể lại nó rất là nhiều lần rồi</td>\n",
" <td>và trường hợp mà lừa tiền không biết là bao nhiêu lần để mà kể lại nó rất là nhiều lần rồi</td>\n",
" <td>và trường hợp mà lừa tiền không biết là bao nhiêu lần để mà kể lại nó rất là nhiều lần rồi</td>\n",
" </tr>\n",
" <tr>\n",
" <th>13</th>\n",
" <td>spk20h-000003-utt000000071</td>\n",
" <td>bé hà vội vàng giới thiệu</td>\n",
" <td>đã hà vội vàng giới thiệu</td>\n",
" <td>đã hà vội vàn giới thiệu</td>\n",
" </tr>\n",
" <tr>\n",
" <th>14</th>\n",
" <td>program-0031-00524</td>\n",
" <td>và anh em chúng tôi đã có những hiến kế như thế thì hy vọng là có thể</td>\n",
" <td>và nghe chúng tôi đã có những cái như thế như thế hy vọng là có thể</td>\n",
" <td>vànhnghe chúng tôi đã có những c nư kế như thế hy vọng là có thể</td>\n",
" </tr>\n",
" <tr>\n",
" <th>15</th>\n",
" <td>spk20h-000091-utt000000122</td>\n",
" <td>tôi còn cùng gia đình gấp rút làm nhanh căn nhà này</td>\n",
" <td>tôi còn cùng gia đình gấp rút làm nhanh căn nhà này</td>\n",
" <td>tôi còn cùng gia đình gớp rút làm nhanh căn nhà này</td>\n",
" </tr>\n",
" <tr>\n",
" <th>16</th>\n",
" <td>program-0152-00611</td>\n",
" <td>ờ và anh xã thì thiên về lý trí còn ánh tuyết thì sống thiên về tình cảm</td>\n",
" <td>và anh xã thì thiên về lý trí còn ánh tuyết thì sống thiên về tình cảm</td>\n",
" <td>ờvà anh xã thì thiên về lý trí còn ánh tuyết thì sống thiên về tình cảm</td>\n",
" </tr>\n",
" <tr>\n",
" <th>17</th>\n",
" <td>program-0062-00421</td>\n",
" <td>có nghĩa là em chú ý rất kỹ những điều mà ban giám khảo nói như là hôm qua ngân có nghe một bạn chia sẻ</td>\n",
" <td>có nghĩa là em chủ yếu rất kỹ những điều mà ban giám khảo nói như là hôm qua ngângứgnghemột mẹ chia sẻ</td>\n",
" <td>có nghĩa là em chủ yếu rất kỹ những điều mà ban giám khảo nói như là hôm qua ngân ngứ nghe một bẹ chia sẻ</td>\n",
" </tr>\n",
" <tr>\n",
" <th>18</th>\n",
" <td>program-0021-00004</td>\n",
" <td>lá ngoài đường rụng nhiều hôm nay tôi đi học</td>\n",
" <td>lá ngoài đường rụ gì hôm nay tôi đi</td>\n",
" <td>lá ngoài đường rụ nìu hôm nay tai đi h</td>\n",
" </tr>\n",
" <tr>\n",
" <th>19</th>\n",
" <td>program-0134-00250</td>\n",
" <td>đúng không đấy là cái hậu quả thứ nhất tức là trở thành đói nghèo từ đói nghèo lại tiếp tục đói nghèo</td>\n",
" <td>đúng không đấy là cái hộ bản nhất tức là trở thành đó nhèo từ đó nhau lại tiếp tục đón nè</td>\n",
" <td>đúng không đấy là cái hộ bản nhất tức là trở thành đó nhèo từ đó nhau lại tiếp tục đón nèo</td>\n",
" </tr>\n",
" <tr>\n",
" <th>20</th>\n",
" <td>spk20h-000066-utt000000162</td>\n",
" <td>và dậy cho bọn người xấu những bài học nhớ đời</td>\n",
" <td>và dạy cho bọn người xấu những bài học nhớ đời</td>\n",
" <td>và dạnh cho mọn người xấu những bài học nhớ đời</td>\n",
" </tr>\n",
" <tr>\n",
" <th>21</th>\n",
" <td>program-0014-00066</td>\n",
" <td>muốn đạt được điều đó có lẽ mỗi người cán bộ đều phải nhận thức được vai trò trách nhiệm của mình trong việc phục vụ nhân dân</td>\n",
" <td>muốn đạt được điều đó có lẽ mỗi người cán bộ đều phải nhận thức được vai trò trách nhiệm của mình trong việc phục vụ nhân dân</td>\n",
" <td>muốn đạt được điều đó có lẽ mỗi người cán bộ đều phải nhận thức được vai trò trách nhiệm của mình trong việc phục vụ nhân dân</td>\n",
" </tr>\n",
" <tr>\n",
" <th>22</th>\n",
" <td>spk20h-000031-utt000000133</td>\n",
" <td>bố</td>\n",
" <td>đúng</td>\n",
" <td>đú</td>\n",
" </tr>\n",
" <tr>\n",
" <th>23</th>\n",
" <td>program-0022-00668</td>\n",
" <td>con chưa nhớ rõ công thức thì mẹ con sẽ hỗ trợ</td>\n",
" <td>con chưa nhớ võ công sức thì mẹ con sẽ hỗ trợ</td>\n",
" <td>con chưa nhớ võ công sức thì mẹ con sẽ hỗ trợ</td>\n",
" </tr>\n",
" <tr>\n",
" <th>24</th>\n",
" <td>spk20h-000077-utt000000089</td>\n",
" <td>bây giờ tôi đã là y đông</td>\n",
" <td>bây giờ tôi đã là đông</td>\n",
" <td>bây giờ tôi đã là i đâng</td>\n",
" </tr>\n",
" <tr>\n",
" <th>25</th>\n",
" <td>program-0130-00317</td>\n",
" <td>êm ái và nhân văn dạ là khi cháu đang nói chuyện với chú thì cháu đang thực sự cảm nhận là chú vẫn mong muốn mình có được một cơ hội</td>\n",
" <td>em bảo nhân vẫn nhà khi cháu đang nói chuyện với chú thì cháu đang thực sự cảm nhận là chú vẫn mong muốn mình có được một cơ hội</td>\n",
" <td>ìm i bào nhân vẫn ạ nhà khi cháu đang nói chuyện với chú thì cháu đang thực sự cảm nhận là chú vẫn mong muốn mình có được một cơ hội</td>\n",
" </tr>\n",
" <tr>\n",
" <th>26</th>\n",
" <td>program-0108-00066</td>\n",
" <td>dù gì ông cũng là một đại gia</td>\n",
" <td>dù gì ông cũng là một đại gia</td>\n",
" <td>dù gì ông cũng là một đại gia</td>\n",
" </tr>\n",
" <tr>\n",
" <th>27</th>\n",
" <td>program-0111-00553</td>\n",
" <td>khán giả theo dõi chương trình và tham gia bình chọn nhân vật được yêu thích nhất trong tuần sẽ có</td>\n",
" <td>khán giả theo dõi chương trình và tham gia bình chọn nhân vật được yêu thích nhất trong tuần sẽ có</td>\n",
" <td>khán giả theo dõi chương trình và tham gia bình chọn nhân vật được yêu thích nhất trong tuần sẽ có</td>\n",
" </tr>\n",
" <tr>\n",
" <th>28</th>\n",
" <td>program-0033-00677</td>\n",
" <td>bao giờ cưới bao giờ lấy chồng tao từng ngày tuổi đầu rồi còn chưa có cháu bế rồi</td>\n",
" <td>ba là cưới bao giờ lấy chồng tao từng này tuổi đầu rồi còn chưa có cháu bế rồi</td>\n",
" <td>ba là cưới bao giờ lấy chồng tao từng này tuổi đầu rồi còn chưa có cháu bế rồi</td>\n",
" </tr>\n",
" <tr>\n",
" <th>29</th>\n",
" <td>program-0107-00329</td>\n",
" <td>sẵn tiện á ra mắt tí với anh luôn rồi bà con hàng xóm nữa</td>\n",
" <td>sẵn tiện á ra mắt tí với anh luôn rồi bà con hàng xóm nữa</td>\n",
" <td>sảng tiền á ca mắt tí với anh luôn rồi bà câu hàng xớm nữa</td>\n",
" </tr>\n",
" </tbody>\n",
"</table>"
],
"text/plain": [
"<IPython.core.display.HTML object>"
]
},
"metadata": {}
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 1000
},
"id": "na92cc7YUNIs",
"outputId": "f2d588ff-0569-4d1a-9f85-732c2a21c192"
},
"source": [
"show_random_elements(results_vivos, columns=['id', 'target_text', 'pred_str_beam', 'pred_str'], num_examples=30)"
],
"execution_count": null,
"outputs": [
{
"output_type": "display_data",
"data": {
"text/html": [
"<table border=\"1\" class=\"dataframe\">\n",
" <thead>\n",
" <tr style=\"text-align: right;\">\n",
" <th></th>\n",
" <th>id</th>\n",
" <th>target_text</th>\n",
" <th>pred_str_beam</th>\n",
" <th>pred_str</th>\n",
" </tr>\n",
" </thead>\n",
" <tbody>\n",
" <tr>\n",
" <th>0</th>\n",
" <td>VIVOSDEV02_T004</td>\n",
" <td>hôm nay em có tới năm khách</td>\n",
" <td>hôm nay em có tới năm khác</td>\n",
" <td>hôm nay em có tới năm khác</td>\n",
" </tr>\n",
" <tr>\n",
" <th>1</th>\n",
" <td>VIVOSDEV13_255</td>\n",
" <td>có lẽ đây là lời quảng cáo không công hay nhất cho du lịch lào</td>\n",
" <td>có lẽ đây là lời quảng cáo không công hay nhất cho du lịch nào</td>\n",
" <td>có lẽ đây là lời quảng cáo không công hay nhất cho du lịch nào</td>\n",
" </tr>\n",
" <tr>\n",
" <th>2</th>\n",
" <td>VIVOSDEV05_226</td>\n",
" <td>một cú ngoặt không chính xác</td>\n",
" <td>một cú ngoặt không chính xác</td>\n",
" <td>một cú ngoặc không chính xác</td>\n",
" </tr>\n",
" <tr>\n",
" <th>3</th>\n",
" <td>VIVOSDEV18_250</td>\n",
" <td>lần đầu tiên một nhân viên người việt thách thức việc tác nghiệp của tôi</td>\n",
" <td>lần đầu tiên một nhân viên người việt thách thức việc tác nghiệp của tôi</td>\n",
" <td>lần đầu tiên một nhân viên người việt thách thức việc tác nghiệp của tôi</td>\n",
" </tr>\n",
" <tr>\n",
" <th>4</th>\n",
" <td>VIVOSDEV11_273</td>\n",
" <td>trọng tài phạt thẻ đỏ</td>\n",
" <td>trọng tài phạt thẻ đỏ</td>\n",
" <td>trọng tài phạt thả đỏ</td>\n",
" </tr>\n",
" <tr>\n",
" <th>5</th>\n",
" <td>VIVOSDEV06_240</td>\n",
" <td>tám mươi sáu tám mươi bảy</td>\n",
" <td>tám mươi sáu tám mươi bảy</td>\n",
" <td>tám mươi sáu tám mươi bảy</td>\n",
" </tr>\n",
" <tr>\n",
" <th>6</th>\n",
" <td>VIVOSDEV01_R188</td>\n",
" <td>việc quy tội để bùng nổ loại sách này là do</td>\n",
" <td>việc quy tội để bùng nổ loại sách này là do</td>\n",
" <td>việc quy tội để bùng nổ loại sách này là do</td>\n",
" </tr>\n",
" <tr>\n",
" <th>7</th>\n",
" <td>VIVOSDEV12_275</td>\n",
" <td>tôi không thấy gì là đúng khi tăng giá xe vào các dịp tết</td>\n",
" <td>tôi không thấy gì là đúng khi tăng giá xe vào các dịp tết</td>\n",
" <td>tôi không thấy gì là đúng khi tăng giá xe vào các dịp tết</td>\n",
" </tr>\n",
" <tr>\n",
" <th>8</th>\n",
" <td>VIVOSDEV01_T043</td>\n",
" <td>nó trốn mất tiêu rồi còn đâu</td>\n",
" <td>nói chốn mức tiêu rồi còn đâu</td>\n",
" <td>nói chốn mức tiêu gọi còn đâu</td>\n",
" </tr>\n",
" <tr>\n",
" <th>9</th>\n",
" <td>VIVOSDEV18_120</td>\n",
" <td>bạn không bao giờ ra ngoài mà không dùng kem lót</td>\n",
" <td>bạn không bao giờ ra ngoài mà không dùng kem lót</td>\n",
" <td>bạn không bao giờ ra ngoài mà không dùng kem lót</td>\n",
" </tr>\n",
" <tr>\n",
" <th>10</th>\n",
" <td>VIVOSDEV13_227</td>\n",
" <td>tại đây có một ông trưởng phòng nhân sự công ty</td>\n",
" <td>tại đây có một ông trưởng phòng nhân sự công ty</td>\n",
" <td>tại đây có một ông trưởng phòng nhân sự công ty</td>\n",
" </tr>\n",
" <tr>\n",
" <th>11</th>\n",
" <td>VIVOSDEV17_189</td>\n",
" <td>vẫn còn nhưng bạn không dám chắc họ có hạnh phúc hay không</td>\n",
" <td>vẫn còn nhưng bạn không dám chắc họ có hạnh phúc hay không</td>\n",
" <td>vẫn còn nhưng bạn không dám chắt họ có hạnh phúc hay không</td>\n",
" </tr>\n",
" <tr>\n",
" <th>12</th>\n",
" <td>VIVOSDEV10_212</td>\n",
" <td>ba mươi ba mươi mốt</td>\n",
" <td>ba mươi ba mươi mốt</td>\n",
" <td>ba mươi ba mươi mốt</td>\n",
" </tr>\n",
" <tr>\n",
" <th>13</th>\n",
" <td>VIVOSDEV18_102</td>\n",
" <td>cả ngày trời không nắng gió lạnh nên thưa vắng du khách</td>\n",
" <td>ngày trời không nắng gió lặn nên thưa vắng du khách</td>\n",
" <td>ngày trời không nắng gió lặn nên thưa vắng du khách</td>\n",
" </tr>\n",
" <tr>\n",
" <th>14</th>\n",
" <td>VIVOSDEV11_129</td>\n",
" <td>đi bộ leo núi đến nhừ chân</td>\n",
" <td>đi bộ leo núi đến nhiều chân</td>\n",
" <td>đi bộ leo nuối đến nhiều chân</td>\n",
" </tr>\n",
" <tr>\n",
" <th>15</th>\n",
" <td>VIVOSDEV06_139</td>\n",
" <td>còn bộ khang hi từ điển</td>\n",
" <td>còn bộ khăng hy từ điển</td>\n",
" <td>còn bộ khăng hi từ điển</td>\n",
" </tr>\n",
" <tr>\n",
" <th>16</th>\n",
" <td>VIVOSDEV17_120</td>\n",
" <td>sau đó bản thân học sinh phải làm đơn xin học bổng</td>\n",
" <td>sau đó bản thân học sinh phải làm đơn sinh học bổng</td>\n",
" <td>sau đó bản thân học sinh phải làm đơn sinh học bộng</td>\n",
" </tr>\n",
" <tr>\n",
" <th>17</th>\n",
" <td>VIVOSDEV03_R056</td>\n",
" <td>sương mù đã đọng thành những hạt giá băng</td>\n",
" <td>sương mù đã động thành những hạt giá băng</td>\n",
" <td>sương mùu đã động thành những hạt giá băng</td>\n",
" </tr>\n",
" <tr>\n",
" <th>18</th>\n",
" <td>VIVOSDEV09_039</td>\n",
" <td>thịt ngọt lừ ấy lại mang theo trùng sán gây bệnh</td>\n",
" <td>thịt ngọt lừ ấy lại mang trùng sáng gây bệnh</td>\n",
" <td>thịt ngọt lừa ấy lại mang trùng sáng ngây bệnh</td>\n",
" </tr>\n",
" <tr>\n",
" <th>19</th>\n",
" <td>VIVOSDEV12_011</td>\n",
" <td>đó chứng tỏ rằng chúng ta đã già</td>\n",
" <td>đó chứng tỏ rằng chúng ta đã già</td>\n",
" <td>đó chứng tỏ rằng chúng ta đã già</td>\n",
" </tr>\n",
" <tr>\n",
" <th>20</th>\n",
" <td>VIVOSDEV15_198</td>\n",
" <td>nhảm nhí khi giờ học chán phèo buồn ngủ quá ờ buồn ngủ</td>\n",
" <td>nhảm nhí khi giờ học chán phèo buồn ngủ quá buồn ngủ</td>\n",
" <td>nhạm nhí khi giờ học trán vhèo buồn ngủ quá ờ buồn ngủ</td>\n",
" </tr>\n",
" <tr>\n",
" <th>21</th>\n",
" <td>VIVOSDEV08_025</td>\n",
" <td>đạo diễn trẻ này có nhiều điều ngẫm ngợi về nghề</td>\n",
" <td>đạo diễn trẻ này có nhiều điều ngẫm ngợi về nghề</td>\n",
" <td>đạo diễn trẻ này có nhiều điều ngẫm ngợi về nghề</td>\n",
" </tr>\n",
" <tr>\n",
" <th>22</th>\n",
" <td>VIVOSDEV14_163</td>\n",
" <td>chú bộ đội qua những câu chuyện của ông mới gần gũi làm sao</td>\n",
" <td>chưa bộ đội qua những câu chuyện của ông mới gần gũi làm sao</td>\n",
" <td>chưa bộ đội qua những câu chuyện của ông mới gần gũi làm sao</td>\n",
" </tr>\n",
" <tr>\n",
" <th>23</th>\n",
" <td>VIVOSDEV19_167</td>\n",
" <td>các qui định của pháp luật không thể được ban hành theo kiểu đánh lén</td>\n",
" <td>các quy định của pháp luật không thể được ban hành theo kiểu đánh lén</td>\n",
" <td>các quy định của pháp luật không thể được ban hành theo kiểu đánh lén</td>\n",
" </tr>\n",
" <tr>\n",
" <th>24</th>\n",
" <td>VIVOSDEV11_033</td>\n",
" <td>mà phải che chái ở tạm bên hông nhà cha ruột</td>\n",
" <td>mà phải che trái ở tạm bên hông nhà cha ruột</td>\n",
" <td>mà phải che trái ở tạm bên hông nhà cha ruột</td>\n",
" </tr>\n",
" <tr>\n",
" <th>25</th>\n",
" <td>VIVOSDEV06_195</td>\n",
" <td>phải được thực hiện trên cơ sở</td>\n",
" <td>phải được thực hiện trên cơ sở</td>\n",
" <td>phải được thực hiện trên cơ sở</td>\n",
" </tr>\n",
" <tr>\n",
" <th>26</th>\n",
" <td>VIVOSDEV12_227</td>\n",
" <td>sáu mươi sáu mươi mốt</td>\n",
" <td>sáu mười sáu mười một</td>\n",
" <td>sáu mười sáu mười một</td>\n",
" </tr>\n",
" <tr>\n",
" <th>27</th>\n",
" <td>VIVOSDEV19_020</td>\n",
" <td>lên các cuộc hẹn phỏng vấn và thực hiện phỏng vấn</td>\n",
" <td>lên các cuộc hẹn phỏng vấn và thực hiện phỏng vấn</td>\n",
" <td>lên các cuộc hẹn phỏng vấn và thực hiện phỏng vấn</td>\n",
" </tr>\n",
" <tr>\n",
" <th>28</th>\n",
" <td>VIVOSDEV16_026</td>\n",
" <td>cùng vợ ăn vội chén cơm thành lại lo ôn bài làm bài tập</td>\n",
" <td>cùng vợ ăn vội chán cơm thành lại lo ôn bài làm bài tập</td>\n",
" <td>cùng vợ ăn vộ cháng cơm thành lại lo ôm bày làm bài tập</td>\n",
" </tr>\n",
" <tr>\n",
" <th>29</th>\n",
" <td>VIVOSDEV15_038</td>\n",
" <td>một cơ quan chính thức để khách hàng khiếu nại tham khảo và tin tưởng</td>\n",
" <td>một cơ quan chính thức để khách hàng khiếu nại tham khảo và tin tưởng</td>\n",
" <td>một cơ quan chính thức để khách hàng khiếu nại tham khảo và tin tưởng</td>\n",
" </tr>\n",
" </tbody>\n",
"</table>"
],
"text/plain": [
"<IPython.core.display.HTML object>"
]
},
"metadata": {}
}
]
},
{
"cell_type": "markdown",
"metadata": {
"id": "KjxgvsH9_6W9"
},
"source": [
"# Export model"
]
},
{
"cell_type": "code",
"metadata": {
"id": "-9XD2PfU94XI"
},
"source": [
"w2v_model.save_pretrained(save_directory='./model')\n",
"w2v_processor.save_pretrained(save_directory='./model')"
],
"execution_count": null,
"outputs": []
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/"
},
"id": "xlgbTGb3Aab0",
"outputId": "5f51ce64-3ef3-4963-8baf-604149aae3ef"
},
"source": [
"map_to_result(speech_file_to_array_fn('/content/wav2vec2-base-vietnamese-250h/t1_0001-00010.wav'))"
],
"execution_count": null,
"outputs": [
{
"output_type": "execute_result",
"data": {
"text/plain": [
"{'file': '/content/wav2vec2-base-vietnamese-250h/t1_0001-00010.wav',\n",
" 'pred_str': 'rồi cũng hỗ trợ cho lâu lâu cũng cho gào cho này kia',\n",
" 'pred_str_beam': 'rồi cũng hỗ trợ cho lâu lâu cũng cho gà cho này kia',\n",
" 'sampling_rate': 16000,\n",
" 'speech': array([-0.02694702, -0.03182983, -0.02288818, ..., -0.00753784,\n",
" -0.01434326, -0.01483154], dtype=float32)}"
]
},
"metadata": {},
"execution_count": 13
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/"
},
"id": "9reALZuBFbET",
"outputId": "8b8ef0a4-2540-4d9b-c8ce-0883ef9fe338"
},
"source": [
"from transformers import Wav2Vec2Processor, Wav2Vec2ForCTC\n",
"from datasets import load_dataset\n",
"import soundfile as sf\n",
"import torch\n",
"\n",
"# load model and tokenizer\n",
"processor = Wav2Vec2Processor.from_pretrained(\"/content/wav2vec2-base-vietnamese-250h\")\n",
"model = Wav2Vec2ForCTC.from_pretrained(\"/content/wav2vec2-base-vietnamese-250h\")\n",
"\n",
"# define function to read in sound file\n",
"def map_to_array(batch):\n",
" speech, _ = sf.read(batch[\"file\"])\n",
" batch[\"speech\"] = speech\n",
" return batch\n",
"\n",
"# load dummy dataset and read soundfiles\n",
"ds = map_to_array({\n",
" \"file\": '/content/wav2vec2-base-vietnamese-250h/audio-test/t1_0001-00010.wav'\n",
"})\n",
"\n",
"# tokenize\n",
"input_values = processor(ds[\"speech\"], return_tensors=\"pt\", padding=\"longest\").input_values # Batch size 1\n",
"\n",
"# retrieve logits\n",
"logits = model(input_values).logits\n",
"\n",
"# take argmax and decode\n",
"predicted_ids = torch.argmax(logits, dim=-1)\n",
"transcription = processor.batch_decode(predicted_ids)"
],
"execution_count": null,
"outputs": [
{
"output_type": "stream",
"text": [
"Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.\n",
"It is strongly recommended to pass the ``sampling_rate`` argument to this function.Failing to do so can result in silent errors that might be hard to debug.\n"
],
"name": "stderr"
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/",
"height": 263,
"referenced_widgets": [
"2336ee0aae994d80a30cd9d665264962",
"2d27c26eacb24f9b9b971e41ed9db13c",
"7dee256620604982bc538d1b05b897bf",
"c51b210e33514459a2a849ab6fcd0055",
"297f1516d87640d4b1fcee6f39ace572",
"577cce00d25b43558a9c990130e4fde5",
"1a194381fec64895ad4f5a1a9abf539d",
"c3a351c6933f4effbad601f9f09f5cfe",
"77eedc2a3c5b443e9e38a072c594b39c",
"660c05932a904626b457f617a193dfb2",
"f4ac069baf24454b9a187b6c6613bf36",
"b15db42a25734e39bf9b2b09c1ba3f0c",
"8ffc95ac6a8b4f3fb21d3860ee28bc4f",
"ad2d9b1d3bf440eb96b2cb0eb7893257",
"1744c10e599d4274b3544fe617c46d59",
"ba57184839a84c88a6e7e1ed7828b455",
"f4ccca8315f34eda9be6694edf8383a8",
"5e22a3bb93fc4827925cc75f0ea306de",
"70a5b6adfd924d4b91bf79d7c97d339c",
"609a977174284ac5ad87138d9c8aa789",
"bbd0ebe3f7cc4546bd9dec0dd95682a3",
"9c848244f19c4ab09679e077daebd5f4",
"80eaafe796d64a5a921fc1002c5f22a0",
"9efcb0bca9194b2cae3b7825f15c2629",
"bf531bfb55a844dabf8520fa3ea28dc2",
"0e7f955be7784613b72d06add422c540",
"16b5f1f02a75436c94eb2be7e860b1af",
"b95b7af4f82545eea259ce89a8089292",
"81310fb5e40c4736808d053203576bd0",
"ccf7a0e2b2204a99a6977002a5e224dd",
"24d53211476545fe87e64432b9c370a0",
"1cce0d6b348644f78c31ad56997d8616",
"0c26f3bf3835402aa1404a300cec9e5b",
"667b4fd4b23a4c879fc60f32c5989c88",
"f88061d60ca74b8a9a3fa7fc8f38ff09",
"0fae0c3e505d467980279054d3e15a87",
"868d81aed9d64e098f7cd7123b2860d4",
"a2ae2f442e0042d7a983ccab311a7f4c",
"634bffe05c4c40b1aa031b555af2cabd",
"23ada557c1aa44c29e35c03bfdbf1b9b",
"74392f18de124c769ecc09bc25ad9c3d",
"1c17a01cd8664b9286ebd5718dacaa9d",
"0d5a345905b940dfb9f16e1ce16cb58c",
"39dd19f88d2c4e65a992179dd71fde11",
"32ac0964bad14718a064e1303cb76f59",
"206d355c23834e3ebb9a358af1798734",
"aca57a480b524747a442dca17a2ba052",
"907febb8013b4146b1bdc3e0728c15a4",
"5d7a5acc092047f28298527e5838439c",
"ee19ad3e8837495ab622383124c37708",
"144adcef4aa047ea965544ac9ef84988",
"d7d5b787f26841c881bd22fcd5ec6bd9",
"79dcc2039d494fb594b1387e11d46754",
"844695218978471aa94ff2e259138441",
"71adcab2263d4f2aacfcd61d7373ffd4",
"61ab200f804f4467b2d1d94391cf06b3",
"8a7f4c6eea54459bae4ddd8fac318541",
"4bdc7eda716149bcb4e4055d414919c7",
"a36634c985e942cb8bad6f81c36fdcf5",
"cc9abfbba8d5468f94eb8b6c17693bb3",
"a5df2d912ce2462fa00ede50be420bc4",
"2b00c333872e41b6b75be5f2a29123ae",
"0666e6ba2e57454c89d7a9093a6b195e",
"11f9cf2034794a46be6cdf0daccdadae",
"bb960e43699b4ef1bfb4c8c702e428c6",
"57e7963bbd13431b90d27fdf31f0fd1d"
]
},
"id": "-ykXv2PoKBWf",
"outputId": "cbcda3da-0964-4213-cd16-4fb5bca6e72e"
},
"source": [
"from transformers import Wav2Vec2Processor, Wav2Vec2ForCTC\n",
"from datasets import load_dataset\n",
"import soundfile as sf\n",
"import torch\n",
"\n",
"# load model and tokenizer\n",
"processor = Wav2Vec2Processor.from_pretrained(\"nguyenvulebinh/wav2vec2-base-vietnamese-250h\")\n",
"model = Wav2Vec2ForCTC.from_pretrained(\"nguyenvulebinh/wav2vec2-base-vietnamese-250h\")\n",
"\n",
"# define function to read in sound file\n",
"def map_to_array(batch):\n",
" speech, _ = sf.read(batch[\"file\"])\n",
" batch[\"speech\"] = speech\n",
" return batch\n",
"\n",
"# load dummy dataset and read soundfiles\n",
"ds = map_to_array({\n",
" \"file\": '/content/wav2vec2-base-vietnamese-250h/audio-test/t1_0001-00010.wav'\n",
"})\n",
"\n",
"# tokenize\n",
"input_values = processor(ds[\"speech\"], return_tensors=\"pt\", padding=\"longest\").input_values # Batch size 1\n",
"\n",
"# retrieve logits\n",
"logits = model(input_values).logits\n",
"\n",
"# take argmax and decode\n",
"predicted_ids = torch.argmax(logits, dim=-1)\n",
"transcription = processor.batch_decode(predicted_ids)"
],
"execution_count": null,
"outputs": [
{
"output_type": "display_data",
"data": {
"application/vnd.jupyter.widget-view+json": {
"model_id": "2336ee0aae994d80a30cd9d665264962",
"version_minor": 0,
"version_major": 2
},
"text/plain": [
"Downloading: 0%| | 0.00/215 [00:00<?, ?B/s]"
]
},
"metadata": {}
},
{
"output_type": "display_data",
"data": {
"application/vnd.jupyter.widget-view+json": {
"model_id": "b15db42a25734e39bf9b2b09c1ba3f0c",
"version_minor": 0,
"version_major": 2
},
"text/plain": [
"Downloading: 0%| | 0.00/1.11k [00:00<?, ?B/s]"
]
},
"metadata": {}
},
{
"output_type": "display_data",
"data": {
"application/vnd.jupyter.widget-view+json": {
"model_id": "80eaafe796d64a5a921fc1002c5f22a0",
"version_minor": 0,
"version_major": 2
},
"text/plain": [
"Downloading: 0%| | 0.00/181 [00:00<?, ?B/s]"
]
},
"metadata": {}
},
{
"output_type": "display_data",
"data": {
"application/vnd.jupyter.widget-view+json": {
"model_id": "667b4fd4b23a4c879fc60f32c5989c88",
"version_minor": 0,
"version_major": 2
},
"text/plain": [
"Downloading: 0%| | 0.00/85.0 [00:00<?, ?B/s]"
]
},
"metadata": {}
},
{
"output_type": "stream",
"text": [
"Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.\n"
],
"name": "stderr"
},
{
"output_type": "display_data",
"data": {
"application/vnd.jupyter.widget-view+json": {
"model_id": "32ac0964bad14718a064e1303cb76f59",
"version_minor": 0,
"version_major": 2
},
"text/plain": [
"Downloading: 0%| | 0.00/1.65k [00:00<?, ?B/s]"
]
},
"metadata": {}
},
{
"output_type": "display_data",
"data": {
"application/vnd.jupyter.widget-view+json": {
"model_id": "61ab200f804f4467b2d1d94391cf06b3",
"version_minor": 0,
"version_major": 2
},
"text/plain": [
"Downloading: 0%| | 0.00/378M [00:00<?, ?B/s]"
]
},
"metadata": {}
},
{
"output_type": "stream",
"text": [
"It is strongly recommended to pass the ``sampling_rate`` argument to this function.Failing to do so can result in silent errors that might be hard to debug.\n"
],
"name": "stderr"
}
]
},
{
"cell_type": "code",
"metadata": {
"colab": {
"base_uri": "https://localhost:8080/"
},
"id": "ZB94tX3LKFbd",
"outputId": "795f1e77-a71c-4bcd-c959-5971f1696bff"
},
"source": [
"transcription"
],
"execution_count": null,
"outputs": [
{
"output_type": "execute_result",
"data": {
"text/plain": [
"['rồi cũng hỗ trợ cho lâu lâu cũng cho gào cho này kia']"
]
},
"metadata": {},
"execution_count": 27
}
]
},
{
"cell_type": "code",
"metadata": {
"id": "lGnxez8SMrwR"
},
"source": [],
"execution_count": null,
"outputs": []
}
]
}
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment