michaelaye/file_reading.ipynb

## file_reading.ipynb
{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {},
   "outputs": [
    {
     "name": "stdout",
     "output_type": "stream",
     "text": [
      "filename1.txt 0.061106 0.330373 0.010000 3.80000000000033e-05 3.000000000003e-06\n",
      "filename10.txt 0.061106 0.330373 0.010000 3.80000000000033e-05 3.000000000003e-06\n",
      "filename100.txt 0.061106 0.330373 0.010000 3.80000000000033e-05 3.000000000003e-06\n",
      "filename1000.txt 0.061106 0.330373 0.010000 3.80000000000033e-05 3.000000000003e-06\n",
      "filename10000.txt 0.061106 0.330373 0.010000 3.80000000000033e-05 3.000000000003e-06\n"
     ]
    }
   ],
   "source": [
    "cat testfile.txt"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {},
   "outputs": [],
   "source": [
    "def column_sniffer(fname):\n",
    "    with open(fname, 'r') as f:\n",
    "        line = f.readline()\n",
    "    return len(line.split())"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "6"
      ]
     },
     "execution_count": 3,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "column_sniffer('testfile.txt')"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {},
   "outputs": [],
   "source": [
    "d = {}\n",
    "d['filenames'] = []\n",
    "for i in range(column_sniffer('testfile.txt')-1):\n",
    "    d[i+1] = []"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "{'filenames': [], 1: [], 2: [], 3: [], 4: [], 5: []}"
      ]
     },
     "execution_count": 5,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "d"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "metadata": {},
   "outputs": [],
   "source": [
    "with open('testfile.txt', 'r') as f:\n",
    "    for line in f:\n",
    "        tokens = line.split()\n",
    "        d['filenames'].append(tokens[0])\n",
    "        for i, token in enumerate(tokens[1:]):\n",
    "            d[i+1].append(float(token))"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 7,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "{'filenames': ['filename1.txt',\n",
       "  'filename10.txt',\n",
       "  'filename100.txt',\n",
       "  'filename1000.txt',\n",
       "  'filename10000.txt'],\n",
       " 1: [0.061106, 0.061106, 0.061106, 0.061106, 0.061106],\n",
       " 2: [0.330373, 0.330373, 0.330373, 0.330373, 0.330373],\n",
       " 3: [0.01, 0.01, 0.01, 0.01, 0.01],\n",
       " 4: [3.80000000000033e-05,\n",
       "  3.80000000000033e-05,\n",
       "  3.80000000000033e-05,\n",
       "  3.80000000000033e-05,\n",
       "  3.80000000000033e-05],\n",
       " 5: [3.000000000003e-06,\n",
       "  3.000000000003e-06,\n",
       "  3.000000000003e-06,\n",
       "  3.000000000003e-06,\n",
       "  3.000000000003e-06]}"
      ]
     },
     "execution_count": 7,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "d"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python [conda env:py37] *",
   "language": "python",
   "name": "conda-env-py37-py"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.7.3"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 4
}
	{
	"cells": [
	{
	"cell_type": "code",
	"execution_count": 1,
	"metadata": {},
	"outputs": [
	{
	"name": "stdout",
	"output_type": "stream",
	"text": [
	"filename1.txt 0.061106 0.330373 0.010000 3.80000000000033e-05 3.000000000003e-06\n",
	"filename10.txt 0.061106 0.330373 0.010000 3.80000000000033e-05 3.000000000003e-06\n",
	"filename100.txt 0.061106 0.330373 0.010000 3.80000000000033e-05 3.000000000003e-06\n",
	"filename1000.txt 0.061106 0.330373 0.010000 3.80000000000033e-05 3.000000000003e-06\n",
	"filename10000.txt 0.061106 0.330373 0.010000 3.80000000000033e-05 3.000000000003e-06\n"
	]
	}
	],
	"source": [
	"cat testfile.txt"
	]
	},
	{
	"cell_type": "code",
	"execution_count": 2,
	"metadata": {},
	"outputs": [],
	"source": [
	"def column_sniffer(fname):\n",
	" with open(fname, 'r') as f:\n",
	" line = f.readline()\n",
	" return len(line.split())"
	]
	},
	{
	"cell_type": "code",
	"execution_count": 3,
	"metadata": {},
	"outputs": [
	{
	"data": {
	"text/plain": [
	"6"
	]
	},
	"execution_count": 3,
	"metadata": {},
	"output_type": "execute_result"
	}
	],
	"source": [
	"column_sniffer('testfile.txt')"
	]
	},
	{
	"cell_type": "code",
	"execution_count": 4,
	"metadata": {},
	"outputs": [],
	"source": [
	"d = {}\n",
	"d['filenames'] = []\n",
	"for i in range(column_sniffer('testfile.txt')-1):\n",
	" d[i+1] = []"
	]
	},
	{
	"cell_type": "code",
	"execution_count": 5,
	"metadata": {},
	"outputs": [
	{
	"data": {
	"text/plain": [
	"{'filenames': [], 1: [], 2: [], 3: [], 4: [], 5: []}"
	]
	},
	"execution_count": 5,
	"metadata": {},
	"output_type": "execute_result"
	}
	],
	"source": [
	"d"
	]
	},
	{
	"cell_type": "code",
	"execution_count": 6,
	"metadata": {},
	"outputs": [],
	"source": [
	"with open('testfile.txt', 'r') as f:\n",
	" for line in f:\n",
	" tokens = line.split()\n",
	" d['filenames'].append(tokens[0])\n",
	" for i, token in enumerate(tokens[1:]):\n",
	" d[i+1].append(float(token))"
	]
	},
	{
	"cell_type": "code",
	"execution_count": 7,
	"metadata": {},
	"outputs": [
	{
	"data": {
	"text/plain": [
	"{'filenames': ['filename1.txt',\n",
	" 'filename10.txt',\n",
	" 'filename100.txt',\n",
	" 'filename1000.txt',\n",
	" 'filename10000.txt'],\n",
	" 1: [0.061106, 0.061106, 0.061106, 0.061106, 0.061106],\n",
	" 2: [0.330373, 0.330373, 0.330373, 0.330373, 0.330373],\n",
	" 3: [0.01, 0.01, 0.01, 0.01, 0.01],\n",
	" 4: [3.80000000000033e-05,\n",
	" 3.80000000000033e-05,\n",
	" 3.80000000000033e-05,\n",
	" 3.80000000000033e-05,\n",
	" 3.80000000000033e-05],\n",
	" 5: [3.000000000003e-06,\n",
	" 3.000000000003e-06,\n",
	" 3.000000000003e-06,\n",
	" 3.000000000003e-06,\n",
	" 3.000000000003e-06]}"
	]
	},
	"execution_count": 7,
	"metadata": {},
	"output_type": "execute_result"
	}
	],
	"source": [
	"d"
	]
	},
	{
	"cell_type": "code",
	"execution_count": null,
	"metadata": {},
	"outputs": [],
	"source": []
	}
	],
	"metadata": {
	"kernelspec": {
	"display_name": "Python [conda env:py37] *",
	"language": "python",
	"name": "conda-env-py37-py"
	},
	"language_info": {
	"codemirror_mode": {
	"name": "ipython",
	"version": 3
	},
	"file_extension": ".py",
	"mimetype": "text/x-python",
	"name": "python",
	"nbconvert_exporter": "python",
	"pygments_lexer": "ipython3",
	"version": "3.7.3"
	}
	},
	"nbformat": 4,
	"nbformat_minor": 4
	}