Skip to content

Instantly share code, notes, and snippets.

@yunoooo111
Created May 17, 2024 08:47
Show Gist options
  • Save yunoooo111/0c7883e8f5f015d0fc078b9c5f0589e2 to your computer and use it in GitHub Desktop.
Save yunoooo111/0c7883e8f5f015d0fc078b9c5f0589e2 to your computer and use it in GitHub Desktop.
assignment 14
Display the source blob
Display the rendered blob
Raw
{
"cells": [
{
"cell_type": "markdown",
"id": "5c9cf4d4",
"metadata": {},
"source": [
"# Topik 1 = Color Detection\n",
"\n",
"## - Sumber dataset: dataset warna dapat diperoleh dari sumber online , seperti kaggle, github dan lain sebagainya sebagai dataset yang diolah dengan machine learning\n",
"\n",
"\n",
"## - ketersediaan kode: \n",
"#### Frameworks and Libraries:\n",
"TensorFlow (Keras): https://www.tensorflow.org/tutorials/images/classification (Provides pre-trained models and color classification tutorials)\n",
"PyTorch: (Offers flexible neural network building and image classification examples)\n",
"Scikit-learn: https://scikit-learn.org/stable/modules/clustering.html (Useful for color segmentation or clustering tasks)\n",
"OpenCV: https://opencv.org/ (Computer vision library for image preprocessing and color-related tasks)\n",
"#### Online Repositories:\n",
"GitHub\n",
"Kaggle: Search for color detection or colorization kernels to find code snippets and examples (https://www.kaggle.com/)\n",
"\n",
"## -Support Infrastructure e.g Computer Spesifications:\n",
"Hardware:\n",
"\n",
"CPU: Multi-core processor (e.g., Intel Core i5 or AMD Ryzen 5) for efficient image processing and neural network training (if applicable).\n",
"GPU (Optional, Recommended for Deep Learning): A dedicated GPU with sufficient memory (e.g., NVIDIA GeForce GTX 1660 or AMD Radeon RX 570) significantly accelerates deep learning tasks.\n",
"RAM: 8GB RAM is a minimum for basic color detection tasks, but 16GB or more is recommended for larger datasets or deep learning models.\n",
"Storage: Adequate storage space to accommodate the dataset size (consider dataset size + model size, if applicable). SSDs improve loading speeds.\n",
"Software:\n",
"\n",
"Operating System: Windows, macOS, or Linux (choose one with good Python and machine learning library support).\n",
"Python: Latest version (https://www.python.org/) with essential scientific computing libraries like NumPy, pandas, and scikit-learn.\n",
"Deep Learning Framework: TensorFlow or PyTorch (whichever you choose for your implementation).\n",
"OpenCV: For image processing tasks."
]
},
{
"cell_type": "markdown",
"id": "3cde2376",
"metadata": {},
"source": [
"# Topik 2: Rekomendasi Wisata Berdasarkan Ulasan Pengguna\n",
"\n",
"Alasan:\n",
"#### A. Sumber Kumpulan Data: Data ulasan pengguna dapat diperoleh dari situs web ulasan wisata seperti TripAdvisor atau Google Reviews. Selain itu, dataset khusus ulasan wisata tersedia di Kaggle (Kaggle: Hotel and Restaurant Reviews).\n",
"#### B. Ketersediaan Kode: Repositori GitHub menyediakan kode untuk analisis sentimen dan rekomendasi berbasis ulasan pengguna, seperti Review-Sentiment-Analysis.\n",
"#### C. Dukungan Infrastruktur: Memerlukan komputer dengan spesifikasi standar untuk analisis teks, tetapi performa analisis NLP bisa ditingkatkan dengan GPU, menggunakan library seperti NLTK, SpaCy, atau Hugging Face Transformers."
]
},
{
"cell_type": "markdown",
"id": "ed8e8382",
"metadata": {},
"source": [
"# Topik 3 :Mall Customer Segmentation Clustering dengan K-Means\n",
"\n",
"Customer Segmentation adalah kegiatan membagi suatu pelanggan menjadi kelompok kelompok pembeli yang berbeda dengan memiliki kebutuhan, karakteristik atau perilaku yang berbeda. Sehingga dari kondisi tersebut, pelanggan mungkin saja membutuhkan produk atau bauran pemasaran yang berbeda. Teknik mengelompokkan ini bisa kita gunakan metode clustering. Clustering adalah sebuah metode untuk membuat suatu kelompok dari suatu obyek pada suatu cara untuk mengelompokkan objek sesuai dengan keunikannya dalam kelompok-kelompok yang berbeda. \n",
"\n",
"Algoritma yang digunakan yaitu K-Means dan DBSCAN. Sebenarnya ada banyak jenis algoritma machine learning, namun kali ini yang kita bahas hanya 2 algoritma ini. K-Means ialah algoritma yang melakukan pendekatan sederhana untuk mempartisi kumpulan data menjadi K cluster yang berbeda dan tidak tumpamg tindih. Sedangkan algoritma DBSCAN atau Density Based Spatial Clustering of Applications with Noise ialah suatu algoritma clustering yang memiliki gagasan bahwa cluster itu harus memiliki kepadatan yang tinggi. Jika pada area dengan ruang data kerapatannya besar, maka dianggap kosong dan semua titik disana akan dianggap outliers. Hal ini yang membuat DBSCAN cocok untuk melakukan clustering pada data yang memiliki banyak outliers.\n",
"\n",
"Output pada algoritma ini ialah menghasilkan jumlah cluster dengan berbagai jenis karakter masing-masing klasternya."
]
},
{
"cell_type": "code",
"execution_count": null,
"id": "f4497247",
"metadata": {},
"outputs": [],
"source": []
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3 (ipykernel)",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.11.4"
}
},
"nbformat": 4,
"nbformat_minor": 5
}
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment