diff --git a/2018-07-07/contardor_de_palavras.ipynb b/2018-07-07/contardor_de_palavras.ipynb new file mode 100644 index 0000000..6927841 --- /dev/null +++ b/2018-07-07/contardor_de_palavras.ipynb @@ -0,0 +1,345 @@ +{ + "cells": [ + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "# instalação\n", + "\n", + "`docker pull jupyter/pyspark-notebook`\n", + "\n", + "## rodar\n", + "docker run -p 8888:8888 jupyter/scipy-notebook:2c80cf3537ca" + ] + }, + { + "cell_type": "code", + "execution_count": 2, + "metadata": {}, + "outputs": [], + "source": [ + "from pyspark import SparkContext as sc" + ] + }, + { + "cell_type": "code", + "execution_count": 3, + "metadata": {}, + "outputs": [], + "source": [ + "rdd = sc()" + ] + }, + { + "cell_type": "code", + "execution_count": 4, + "metadata": {}, + "outputs": [], + "source": [ + "file = rdd.textFile('tabacaria.txt')" + ] + }, + { + "cell_type": "code", + "execution_count": 13, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "['TabacariaTabacariaTabacariaTabacaria']" + ] + }, + "execution_count": 13, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "file.map(lambda x: x * 2).map(lambda x: x * 2).take(1)" + ] + }, + { + "cell_type": "code", + "execution_count": 23, + "metadata": {}, + "outputs": [], + "source": [ + "resutaldo = file.flatMap(lambda linha: linha.split())\\\n", + " .map(lambda palavra: (palavra, 1))\\\n", + " .reduceByKey(lambda x, y: x +y)" + ] + }, + { + "cell_type": "code", + "execution_count": 24, + "metadata": {}, + "outputs": [], + "source": [ + "resutaldo.saveAsTextFile('tabacaria_contada.txt')" + ] + }, + { + "cell_type": "code", + "execution_count": 11, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "['assim', 'falou', 'zaratustra']" + ] + }, + "execution_count": 11, + "metadata": {}, + "output_type": "execute_result" + } + ], + "source": [ + "from re import compile as r_compile\n", + "\n", + "regex = r_compile('\\w+')\n", + "\n", + "t = '(assim) falou zaratustra.'\n", + "\n", + "regex.findall(t)" + ] + }, + { + "cell_type": "code", + "execution_count": 29, + "metadata": {}, + "outputs": [], + "source": [ + "resutaldo = file.flatMap(lambda linha: regex.findall(linha))\\\n", + " .map(lambda palavra: (palavra, 1))\\\n", + " .reduceByKey(lambda x, y: x +y)" + ] + }, + { + "cell_type": "code", + "execution_count": 30, + "metadata": {}, + "outputs": [], + "source": [ + "resutaldo.saveAsTextFile('tabacaria_regex.txt')" + ] + }, + { + "cell_type": "code", + "execution_count": 12, + "metadata": {}, + "outputs": [], + "source": [ + "resutaldo = file.flatMap(lambda linha: regex.findall(linha.lower()))\\\n", + " .map(lambda palavra: (palavra, 1))\\\n", + " .reduceByKey(lambda x, y: x +y)" + ] + }, + { + "cell_type": "code", + "execution_count": 20, + "metadata": { + "scrolled": false + }, + "outputs": [], + "source": [ + "resutaldo.saveAsTextFile('tabacaria_nom_')" + ] + }, + { + "cell_type": "code", + "execution_count": 14, + "metadata": {}, + "outputs": [], + "source": [ + "from matplotlib.pyplot import bar" + ] + }, + { + "cell_type": "code", + "execution_count": 42, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "" + ] + }, + "execution_count": 42, + "metadata": {}, + "output_type": "execute_result" + }, + { + "data": { + "image/png": "iVBORw0KGgoAAAANSUhEUgAAAW4AAAD8CAYAAABXe05zAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADl0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uIDIuMi4yLCBodHRwOi8vbWF0cGxvdGxpYi5vcmcvhp/UCwAADAxJREFUeJzt3H+MZfVZx/H3RxYDAlLbHYmWbqcmjQYlBTshErQBQhqQ/khaEkusAbVZq1FqUmswGrQx1tZfaWrVutQNTaFtrFpCoZZSdSVYQWZhgaULleBqKcYdYlVITcuPxz/uGTssMztnd+bO7APvV3Iz5975zr3Pbs689+yZcydVhSSpj2/Z7AEkSYfHcEtSM4Zbkpox3JLUjOGWpGYMtyQ1Y7glqRnDLUnNGG5JambLNJ5069atNTs7O42nlqTnpd27dz9WVTNj1k4l3LOzs8zPz0/jqSXpeSnJv45d66kSSWrGcEtSM4Zbkpox3JLUjOGWpGZGXVWSZD/wOPA08FRVzU1zKEnSyg7ncsDzquqxqU0iSRrFUyWS1MzYcBfwuSS7k2yf5kCSpEMbe6rknKp6NMl3ArckeaCqbl26YAj6doBt27at85jS0WP2yps2ewQdpfa/9+INeZ1RR9xV9ejw8QDwKeCsZdbsqKq5qpqbmRn1dntJ0hFYNdxJTkhy0uI28Fpg77QHkyQtb8ypklOATyVZXP+xqvrsVKeSJK1o1XBX1cPAqzZgFknSCF4OKEnNGG5JasZwS1IzhluSmjHcktSM4ZakZgy3JDVjuCWpGcMtSc0YbklqxnBLUjOGW5KaMdyS1IzhlqRmDLckNWO4JakZwy1JzRhuSWrGcEtSM4Zbkpox3JLUjOGWpGYMtyQ1Y7glqRnDLUnNGG5JasZwS1IzhluSmjHcktSM4ZakZgy3JDVjuCWpmdHhTnJMkruT3DjNgSRJh3Y4R9zvAPZNaxBJ0jijwp3kVOBi4MPTHUeStJqxR9zvB34ZeGaKs0iSRtiy2oIkrwMOVNXuJOceYt12YDvAtm3bjnig2StvOuKv1fPb/vdevNkjSEeFMUfc5wBvSLIf+ARwfpJrD15UVTuqaq6q5mZmZtZ5TEnSolXDXVW/UlWnVtUs8Bbgb6vqrVOfTJK0LK/jlqRmVj3HvVRV7QJ2TWUSSdIoHnFLUjOGW5KaMdyS1IzhlqRmDLckNWO4JakZwy1JzRhuSWrGcEtSM4Zbkpox3JLUjOGWpGYMtyQ1Y7glqRnDLUnNGG5JasZwS1IzhluSmjHcktSM4ZakZgy3JDVjuCWpGcMtSc0YbklqxnBLUjOGW5KaMdyS1IzhlqRmDLckNWO4JakZwy1JzRhuSWrGcEtSM6uGO8lxSf4pyT1J7k/y7o0YTJK0vC0j1nwdOL+qnkhyLHBbkr+uqtunPJskaRmrhruqCnhiuHvscKtpDiVJWtmoc9xJjkmyBzgA3FJVd0x3LEnSSkaFu6qerqozgFOBs5L8wMFrkmxPMp9kfmFhYb3nlCQNDuuqkqr6L2AXcOEyn9tRVXNVNTczM7NO40mSDjbmqpKZJC8ato8HLgAemPZgkqTljbmq5LuAjyQ5hkno/7yqbpzuWJKklYy5quRe4MwNmEWSNILvnJSkZgy3JDVjuCWpGcMtSc0YbklqxnBLUjOGW5KaMdyS1IzhlqRmDLckNWO4JakZwy1JzRhuSWrGcEtSM4Zbkpox3JLUjOGWpGYMtyQ1Y7glqRnDLUnNGG5JasZwS1IzhluSmjHcktSM4ZakZgy3JDVjuCWpGcMtSc0YbklqxnBLUjOGW5KaMdyS1Myq4U7ysiR/l2RfkvuTvGMjBpMkLW/LiDVPAe+sqruSnATsTnJLVX1xyrNJkpax6hF3Vf17Vd01bD8O7ANeOu3BJEnLO6xz3ElmgTOBO6YxjCRpdaPDneRE4C+BX6yq/1nm89uTzCeZX1hYWM8ZJUlLjAp3kmOZRPu6qvqr5dZU1Y6qmququZmZmfWcUZK0xJirSgL8GbCvqv5g+iNJkg5lzBH3OcBPAOcn2TPcfnTKc0mSVrDq5YBVdRuQDZhFkjSC75yUpGYMtyQ1Y7glqRnDLUnNGG5JasZwS1IzhluSmjHcktSM4ZakZgy3JDVjuCWpGcMtSc0YbklqxnBLUjOGW5KaMdyS1IzhlqRmDLckNWO4JakZwy1JzRhuSWrGcEtSM4Zbkpox3JLUjOGWpGYMtyQ1Y7glqRnDLUnNGG5JasZwS1IzhluSmjHcktSM4ZakZlYNd5KdSQ4k2bsRA0mSDm3MEfc1wIVTnkOSNNKq4a6qW4H/3IBZJEkjrNs57iTbk8wnmV9YWFivp5UkHWTdwl1VO6pqrqrmZmZm1utpJUkH8aoSSWrGcEtSM2MuB/w48I/A9yZ5JMlPT38sSdJKtqy2oKou3YhBJEnjeKpEkpox3JLUjOGWpGYMtyQ1Y7glqRnDLUnNGG5JasZwS1IzhluSmjHcktSM4ZakZgy3JDVjuCWpGcMtSc0YbklqxnBLUjOGW5KaMdyS1IzhlqRmDLckNWO4JakZwy1JzRhuSWrGcEtSM4Zbkpox3JLUjOGWpGYMtyQ1Y7glqRnDLUnNGG5JasZwS1Izo8Kd5MIkDyZ5KMmV0x5KkrSyVcOd5Bjgj4CLgNOAS5OcNu3BJEnLG3PEfRbwUFU9XFXfAD4BvHG6Y0mSVjIm3C8Fvrzk/iPDY5KkTbBlxJos81g9Z1GyHdg+3H0iyYNrGUwAbAUe2+whjhZ532ZPoBW4nw7WuI++fOzCMeF+BHjZkvunAo8evKiqdgA7xr6wVpdkvqrmNnsO6VDcTzfemFMldwKvTPKKJN8KvAW4YbpjSZJWsuoRd1U9leTngZuBY4CdVXX/1CeTJC1rzKkSquozwGemPIuey1NP6sD9dIOl6jk/Z5QkHcV8y7skNWO4j1CS2SR7D2P95Um++3DXJfnwau9UTXJNkkvGziIluSLJviTXrfD5uSQfGLbfsF6/6iLJ/iRb1+O5XshGnePWurgc2Msyl1Ieal1VvW2qU+mF6ueAi6rqX5b7ZFXNA/PD9g14JdlRxSPutdmS5CNJ7k3yF0m+LclVSe5MsjfJjkxcAswB1yXZk+T4w1i3K8kcQJInkvxWknuS3J7klCWzvCbJF5I8vHj0neTEJH+T5K4k9yV54/D4CUluGp5nb5If2+C/N22iJB8Cvge4IcmvJtk57It3L9lHzk1y47B9eZIPDtsvH/ape4eP24bHX5/kjuE5Pr+4byZ5SZLPDY//KUve0Jfk+iS7k9w/vIFPY1WVtyO4AbNM3kF6znB/J/BLwIuXrPko8Pphexcwt+RzY9f9//3h9RbX/Q7wa8P2NcAnmfxDfBqT3y0Dk/9RffuwvRV4iMk3zpuBq5e8xsmb/ffpbcP33/3DPvEe4K3DYy8CvgScAJwL3Dg8fjnwwWH708Blw/ZPAdcP29/BNy92eBvw+8P2B4Crhu2Lh31463D/xcPH45n8L/Mlm/330uXmEffafLmq/mHYvhb4YeC84cjjPuB84PtX+Nqx65b6BnDjsL2byT8ei66vqmeq6ovA4pF4gPckuRf4PJPfMXMKcB9wQZL3JfmRqvrvMX9YPS+9FrgyyR4mBwnHAdsOsf5s4GPD9keZ7PMweUf1zcP+/C6+uT+/hsn3BlV1E/DVJc91RZJ7gNuZvDv7lWv9w7xQGO61OfhaygL+GLikqk4HrmbyjfAsSY4bs24ZT9ZwiAI8zbN/RvH1pS8xfPxxYAZ4dVWdAfwHcFxVfQl4NZOA/3aSq0a8tp6fAry5qs4Ybtuqat9hfP3i/viHTI7KTwd+hmfvz8v9bqNzgQuAs6vqVcDdjPseEIZ7rbYlOXvYvhS4bdh+LMmJwNIrPR4HThq2jxu5bq1OBg5U1ZNJzmP4JTbDVStfq6prgd8DfnCdXk/93Az8QpIAJDlzlfVfYPJrL2ByYLC4z58MfGXYvmzJ+luHdSS5iMkplcX1X62qryX5PuCH1vKHeKHxqpK12QdcNvzQ5Z+BP2GyY97H5BzinUvWXgN8KMn/Mvnv5tUj163FdcCnk8wDe4AHhsdPB343yTPAk8DPrvF11NdvAu8H7h3ivR943TLrFo+arwB2JnkXsAD85PD4bwCfTPIVJqc+XjE8/m7g40nuAv4e+Lfh8c8Cbx9O4z04fI1G8p2Tkg4pyTuZ/JD71zd7Fk14xC1pRUnezuSqkjdt8ihawiNuSWrGH05KUjOGW5KaMdyS1IzhlqRmDLckNWO4JamZ/wMVj+rexXSX0wAAAABJRU5ErkJggg==\n", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "bar(['batatinhas', 'feijoada'], [4,5])" + ] + }, + { + "cell_type": "code", + "execution_count": 21, + "metadata": {}, + "outputs": [], + "source": [ + "top_10 = resutaldo.take(10)" + ] + }, + { + "cell_type": "code", + "execution_count": 22, + "metadata": {}, + "outputs": [], + "source": [ + "textos = [val[0] for val in top_10]\n", + "vals = [val[1] for val in top_10]" + ] + }, + { + "cell_type": "code", + "execution_count": 23, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "" + ] + }, + "execution_count": 23, + "metadata": {}, + "output_type": "execute_result" + }, + { + "data": { + "image/png": "iVBORw0KGgoAAAANSUhEUgAAAX4AAAD8CAYAAABw1c+bAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADl0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uIDIuMi4yLCBodHRwOi8vbWF0cGxvdGxpYi5vcmcvhp/UCwAAFllJREFUeJzt3X+0JGV95/H3xwF/Iz+cq0F0HFcJrprA6ixqiAaiIqARTYjCcRWN2VFXo+boZsmaqMfkZPFoNjkJKoLOgomiMWYMhlFAjKLGHwwsMIOgEhyXyRAGRUHEXyPf/aOeC+2l7507XX1nGOr9OqfPrXrqqXqerq7+9NPV3XVTVUiShuMeu7oDkqSdy+CXpIEx+CVpYAx+SRoYg1+SBsbgl6SBMfglaWAMfkkaGINfkgZmj13dgXGWL19eK1eu3NXdkKTdxsUXX/ztqppZTN27ZPCvXLmS9evX7+puSNJuI8m3FlvXUz2SNDAGvyQNjMEvSQNj8EvSwBj8kjQwBr8kDYzBL0kDY/BL0sAY/JI0MHfJX+5KuutaedI5S97GppOfteRtDJkjfkkaGINfkgbG4JekgTH4JWlgDH5JGhiDX5IGxuCXpIEx+CVpYAx+SRoYg1+SBsbgl6SB2e61epKsAZ4NbK2qx7WyDwMHtSr7AN+rqkPGrLsJ+D7wM2BbVa2aUr8lSRNazEXazgBOAd4/W1BVL5idTvLnwE0LrH9EVX170g5KkqZru8FfVRcmWTluWZIAzwd+fbrdkiQtlb7n+J8CXF9V35hneQHnJbk4yeqebUmSpqDv9fhPAM5aYPlhVbUlyYOA85NcVVUXjqvYXhhWA6xYsaJntyRJ85l4xJ9kD+A3gQ/PV6eqtrS/W4G1wKEL1D2tqlZV1aqZmZlJuyVJ2o4+p3qeDlxVVZvHLUxyvyR7zU4DRwIbe7QnSZqC7QZ/krOALwIHJdmc5GVt0fHMOc2T5CFJ1rXZBwOfT3IZ8BXgnKr65PS6LkmaxGK+1XPCPOUvGVO2BTimTV8DHNyzf5KkKfOXu5I0MAa/JA2MwS9JA2PwS9LAGPySNDAGvyQNjMEvSQNj8EvSwBj8kjQwBr8kDYzBL0kDY/BL0sAY/JI0MAa/JA2MwS9JA2PwS9LAGPySNDAGvyQNjMEvSQOzmH+2vibJ1iQbR8rekuTfklzabsfMs+5RSb6W5OokJ02z45KkySxmxH8GcNSY8r+oqkPabd3chUmWAe8EjgYeA5yQ5DF9OitJ6m+7wV9VFwI3TrDtQ4Grq+qaqvoJ8CHg2Am2I0maoj7n+F+d5PJ2KmjfMcsPAK4dmd/cysZKsjrJ+iTrb7jhhh7dkiQtZNLgfzfwSOAQ4Drgz8fUyZiymm+DVXVaVa2qqlUzMzMTdkuStD0TBX9VXV9VP6uq24DT6U7rzLUZeNjI/EOBLZO0J0manomCP8n+I7PPAzaOqXYRcGCSRyS5J3A8cPYk7UmSpmeP7VVIchZwOLA8yWbgzcDhSQ6hO3WzCXh5q/sQ4L1VdUxVbUvyauBcYBmwpqquWJJ7IUlatO0Gf1WdMKb4ffPU3QIcMzK/DrjTVz0lSbuOv9yVpIEx+CVpYAx+SRoYg1+SBsbgl6SBMfglaWAMfkkaGINfkgbG4JekgTH4JWlgDH5JGhiDX5IGxuCXpIEx+CVpYAx+SRoYg1+SBsbgl6SBMfglaWC2G/xJ1iTZmmTjSNnbk1yV5PIka5PsM8+6m5JsSHJpkvXT7LgkaTKLGfGfARw1p+x84HFV9cvA14E/XGD9I6rqkKpaNVkXJUnTtN3gr6oLgRvnlJ1XVdva7JeAhy5B3yRJS2Aa5/h/B/jEPMsKOC/JxUlWT6EtSVJPe/RZOckbgW3AB+apclhVbUnyIOD8JFe1dxDjtrUaWA2wYsWKPt2SJC1g4hF/khOBZwMvrKoaV6eqtrS/W4G1wKHzba+qTquqVVW1amZmZtJuSZK2Y6LgT3IU8D+A51TVrfPUuV+SvWangSOBjePqSpJ2nsV8nfMs4IvAQUk2J3kZcAqwF93pm0uTnNrqPiTJurbqg4HPJ7kM+ApwTlV9cknuhSRp0bZ7jr+qThhT/L556m4BjmnT1wAH9+qdJGnq/OWuJA2MwS9JA2PwS9LAGPySNDAGvyQNjMEvSQNj8EvSwBj8kjQwBr8kDYzBL0kDY/BL0sAY/JI0MAa/JA2MwS9JA2PwS9LAGPySNDAGvyQNjMEvSQOzqOBPsibJ1iQbR8r2S3J+km+0v/vOs+6Jrc43kpw4rY5Lkiaz2BH/GcBRc8pOAi6oqgOBC9r8z0myH/Bm4InAocCb53uBkCTtHIsK/qq6ELhxTvGxwJlt+kzguWNWfSZwflXdWFXfBc7nzi8gkqSdqM85/gdX1XUA7e+DxtQ5ALh2ZH5zK5Mk7SJ7LPH2M6asxlZMVgOrAVasWLGUfdLdyMqTzlnyNjad/Kwlb0PamfqM+K9Psj9A+7t1TJ3NwMNG5h8KbBm3sao6rapWVdWqmZmZHt2SJC2kT/CfDcx+S+dE4B/H1DkXODLJvu1D3SNbmSRpF1ns1znPAr4IHJRkc5KXAScDz0jyDeAZbZ4kq5K8F6CqbgT+BLio3d7ayiRJu8iizvFX1QnzLHramLrrgd8dmV8DrJmod5KkqfOXu5I0MAa/JA2MwS9JA2PwS9LAGPySNDAGvyQNzFJfsmFQvHyAtLR8jk2HI35JGhiDX5IGxuCXpIEx+CVpYAx+SRoYg1+SBsbgl6SBMfglaWAMfkkaGINfkgbmbnfJBn/SLUkLm3jEn+SgJJeO3G5O8ro5dQ5PctNInTf177IkqY+JR/xV9TXgEIAky4B/A9aOqfq5qnr2pO1IkqZrWuf4nwb8a1V9a0rbkyQtkWkF//HAWfMse3KSy5J8Isljp9SeJGlCvYM/yT2B5wAfGbP4EuDhVXUw8NfAxxbYzuok65Osv+GGG/p2S5I0j2mM+I8GLqmq6+cuqKqbq+qWNr0O2DPJ8nEbqarTqmpVVa2amZmZQrckSeNMI/hPYJ7TPEl+IUna9KGtve9MoU1J0oR6fY8/yX2BZwAvHyl7BUBVnQocB7wyyTbgh8DxVVV92pQk9dMr+KvqVuCBc8pOHZk+BTilTxuSpOnykg2SNDB3u0s2DJWXqpC0WI74JWlgDH5JGhiDX5IGxuCXpIEx+CVpYAx+SRoYg1+SBsbgl6SBMfglaWAMfkkaGINfkgbG4JekgTH4JWlgDH5JGhiDX5IGxuCXpIEx+CVpYHoHf5JNSTYkuTTJ+jHLk+Svklyd5PIkj+/bpiRpctP614tHVNW351l2NHBguz0ReHf7K0naBXbGqZ5jgfdX50vAPkn23wntSpLGmMaIv4DzkhTwnqo6bc7yA4BrR+Y3t7LrRislWQ2sBlixYsUUuiXdfa086Zwlb2PTyc9a8ja0a0xjxH9YVT2e7pTOq5I8dc7yjFmn7lRQdVpVraqqVTMzM1PoliRpnN7BX1Vb2t+twFrg0DlVNgMPG5l/KLClb7uSpMn0Cv4k90uy1+w0cCSwcU61s4EXt2/3PAm4qaquQ5K0S/Q9x/9gYG2S2W19sKo+meQVAFV1KrAOOAa4GrgVeGnPNiVJPfQK/qq6Bjh4TPmpI9MFvKpPO5Kk6fGXu5I0MAa/JA2MwS9JA2PwS9LAGPySNDDTukibJN2t3Z0uk+GIX5IGxuCXpIEx+CVpYAx+SRoYg1+SBsbgl6SBMfglaWAMfkkaGINfkgbG4JekgTH4JWlgDH5JGpiJgz/Jw5L8c5Irk1yR5LVj6hye5KYkl7bbm/p1V5LUV5+rc24DXl9VlyTZC7g4yflV9dU59T5XVc/u0Y4kaYomHvFX1XVVdUmb/j5wJXDAtDomSVoaUznHn2Ql8J+AL49Z/OQklyX5RJLHTqM9SdLkev8jliT3Bz4KvK6qbp6z+BLg4VV1S5JjgI8BB86zndXAaoAVK1b07ZYkaR69RvxJ9qQL/Q9U1T/MXV5VN1fVLW16HbBnkuXjtlVVp1XVqqpaNTMz06dbkqQF9PlWT4D3AVdW1f+ep84vtHokObS1951J25Qk9dfnVM9hwIuADUkubWX/E1gBUFWnAscBr0yyDfghcHxVVY82JUk9TRz8VfV5INupcwpwyqRtSJKmz1/uStLAGPySNDAGvyQNjMEvSQNj8EvSwBj8kjQwBr8kDYzBL0kDY/BL0sAY/JI0MAa/JA1M7+vxSytPOmfJ29h08rOWvI0dNdT7rd2fI35JGhiDX5IGxuCXpIEx+CVpYAx+SRoYg1+SBqZX8Cc5KsnXklyd5KQxy++V5MNt+ZeTrOzTniSpv4mDP8ky4J3A0cBjgBOSPGZOtZcB362qRwF/Abxt0vYkSdPRZ8R/KHB1VV1TVT8BPgQcO6fOscCZbfrvgaclWfAftEuSllaf4D8AuHZkfnMrG1unqrYBNwEP7NGmJKmnVNVkKya/DTyzqn63zb8IOLSqfm+kzhWtzuY2/6+tznfGbG81sLrNHgR8baKO7bjlwLd3Ulu2Pey2d3X7tn33bvvhVTWzmIp9rtWzGXjYyPxDgS3z1NmcZA9gb+DGcRurqtOA03r0ZyJJ1lfVqp3drm0Pr+1d3b5tD6vthfQ51XMRcGCSRyS5J3A8cPacOmcDJ7bp44BP16RvMSRJUzHxiL+qtiV5NXAusAxYU1VXJHkrsL6qzgbeB/xNkqvpRvrHT6PTkqTJ9bosc1WtA9bNKXvTyPSPgN/u08ZOsNNPL9n2YNve1e3b9rDantfEH+5KknZPXrJBkgZmtwj+JPsk+W/bqbMyycad1afW5rok+0x5m7dMc3t9JXnOuMtxqL8kzx3za/dJt/Uv09jO3ck0j93FZNCYdc5Ictw02p+23SL4gX2AHdrpSymde1TVMVX1vV3dn77aV23Hqqqzq+rkndCHZUtRd856+yQ5L8n9Jll/mto+fy7d5U56q6pfmcZ27k6mfOzepTKot6q6y9/oLgfxQ+BSumv+XABcAmwAjm11VgJX0V0i4nK6S0Tcty17E93XTzfSfdgy+9nGo4BPAZe17T0SuP8C278SeBfwf4GHA5uA5W35x4CLga8D1wGnA1cA5wH3Af5r68NlwEdH+vYI4Itt2Z8At7Tysf3Yzn66H3BOa2Mj8ALgCcBnW9/OBfZvdT8D/Flb9npgpvXronY7rNV7CXDKmLbeSPcju08BZwFvaNtc1ZYvBza16WXA29t2Lwde3soPB/4Z+CDw1Vb2X4CvtMf6PcCyVn4L8Fbgy8Cv9jiWHjvbxykcl2OPuQWOt9F9/ka6b7p9s93XR7bbJ9tj9Tng0TvQl9njZn/gwrbNjcBT2v4/o81vAH6/1T0E+FLr+1pg3577406PXXvc3tbu06foLvXyGeAa4DlT2PfvbffrA8DTgS8A32jt3H7stvv/7na8XQP8GrCG7jl9xg5m0NvbbXZ/vqDVCXAK8FW65+E64Li27Gl0ubGhtXuvVn5yq3858I5pHJeL2n87q6EpPME2tuk9gAe06eXA1W2HrwSKOwJrDfCGNr3fyLb+BviNNv1l4Hlt+t50T9qFtn8b8KSRbW3ijuDfr/09qPXj19r837UnxANH1vtT4Pfa9NnAi9v0q7jjCTy2H9vZT78FnD4yvzfwL8BMm38B3dduoXvyvWuk7gdpgQqsAK5s0y9hTvDTvZhsaPvrAa1vCwX/auCP2vS9gPV0L3iHAz8AHtGW/Ufg48Cebf5dI/umgOf3PI5mX5yvAFZP6bi80zG3wPE2d5+fQQuGNn8BcGCbfiLd714W25fZ4+b1wBvb9DJgr/Z4nT9Sd5/29/KR4/StwF/22BdjH7u2f45uZWvpBkJ7AgcDl/bc99uAX6I7c3Fx2/+hu0bYx7hz8H9oZPnNc9Y9ZBHtzWbQbwHnt/37YOD/0b3g/uZI+UOA79H9funedJeu+cW2/vuB1wH70Q2eZgcG+/Q9Jhd76/V1zl0kwJ8leSpdEB9At/MBrq2qL7TpvwVeA7wDOCLJH9AF1X7AFUk+AxxQVWvh9q+ekmTPBbb/rar60jz9ek2S59Ed1LcBP27lF9MdNI9L8qd0bxnvTzf6BjiM7kCCLiRmr2A63/389wX2zQbgHUneBvwT8F3gccD57dp4y+jejcz68Mj004HHjFxD7wFJ9pqnnacAa6vqVoAkc3+4N9eRwC+PnO/cGzgQ+Anwlar6Zit/Gl1IXdT6cR9ga1v2M7p3JH38TlXdmOQ+rY2P1pjLh+ygccfcN+ceb3ShCD+/z2+X5P7ArwAfGXkM7jVBfy4C1rTj+GNVdWmSa4D/kOSv6Uai5yXZmy5oPtvWOxP4yATtzZrvsfsJ3bsY6I7PH1fVT5NsoHte9PHNqtoAt18e5oKqqgW2/fGR5dfPWXcl3Wh+MX4VOKuqfgZcn+SzwH8GnjpSviXJp1v9g1pfv97mz6Qb5J0C/Ah4b5Jz6J6zO8XuGPwvpDst8YR2AG2ie0WFbnQxqpLcm270saqqrk3yllZ/vquELrT9H4xbIcnhdMH5ZOBBdE/02XV+RvckOAN4blVdluQldKPd2/u5g/0Yq6q+nuQJwDHA/6IbfVxRVU+eZ5XR+3MP4MlV9cM5923e5saUbeOOz41G+xq6dzjnjlZu++0Hc+qdWVV/OGbbP2pPqD5mX5yhu5TIgUDf4L/TMcf4423W2GOIbr99r6oO6dWZqgvbYOFZdD+efHtVvT/JwcAz6QLn+cDv92lnjLGPXZI3VBvOMjIgqqrbFvpsaZF+PDI9Oti6jfHZ9uMxdReqP5+FrjA87nkxtn51P4I9lO5F83jg1cCv70A/Jra7fLj7fbq3rNCNFre2MDyC7lz7rBVJZkPuBODz3PGk+3YbVR0HUFU3011D6Llw+z+Nue92tj+fven+78CtdOdp7zOmzl7AdW0k9sKR8i9wxy+aR8t3uB9JHgLcWlV/S/dO54nAzOw+SbJnksfOs/p5dAfe7LYWCqALgecluU97V/AbrXwT3agP2n5uzgVe2e47SX5xng9YLwCOS/KgVm+/JIvZ/9s1+uJcVQfTnW9d8IV0kcYdczDneJvH7cd1Ox6/me7ih7NfIDh4RzvT9tfWqjqd7pfzj0+yHLhHVX0U+GPg8VV1E/DdJE9pq76I7rOHSS3ZY3cXMZpBFwIvSLIsyQzdSP8rrfz4Vr4/cESrfxWwMsmj2vyLgM+242Pv6n4I+zq6z1x2it1ixF9V30nyhfZ1zYuARydZT/fW7KqRqlcCJyZ5D90HPO+uqluTnE73NnNTW3/Wi4D3pLvMxE/pfmX8AeDj82x/Pp8EXpHkcrpzeT8cU+eP6T5T+Fbry+xB9Frgg0ley8+fypikH78EvD3Jbe3+vJJuFP5X7a39HsBf0r0jmes1wDvbfdiD7iB+xbhGquqSJB9u/foW3QeR0L3Y/F26K7V+emSV99K9lb4k3VuIG+i+0TJ3u19N8kd0pyLu0e7Dq1obfd3+4pzk0cCTprBNGHPMAfsy/nib60PA6UleQ/cC8ULg3W0f7NmWX7aD/Tkc+O9Jfkr3weqL6U4T/p+2TwFmR+UnAqe2Ac81wEt3sK3bLfDY3S3MyaBP0H0+chndCP8Pqurfk6ylG7FvoPuSx2fbuj9K8lK603h70B0Tp9KdBvzHdlYiTP9d2Lz85a56a6czbqmqd+zqvswnyb3oPvA7gO4DtRngLVX1mR7bXAn8U1U9bgpdlHaa3WLEL/VVVT+m+zeh0uA54pekgdldPtyVJE2JwS9JA2PwS9LAGPySNDAGvyQNjMEvSQPz/wE0TuAYSJX0PgAAAABJRU5ErkJggg==\n", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "bar(textos, vals)" + ] + }, + { + "cell_type": "code", + "execution_count": null, + "metadata": {}, + "outputs": [], + "source": [ + "resutaldo = file.flatMap(lambda linha: regex.findall(linha.lower()))\\\n", + " .ap" + ] + }, + { + "cell_type": "markdown", + "metadata": {}, + "source": [ + "# Com python puro" + ] + }, + { + "cell_type": "code", + "execution_count": 24, + "metadata": {}, + "outputs": [], + "source": [ + "from collections import Counter" + ] + }, + { + "cell_type": "code", + "execution_count": 26, + "metadata": {}, + "outputs": [], + "source": [ + "with open('tabacaria.txt') as f:\n", + " contagem = Counter(regex.findall(f.read().lower()))" + ] + }, + { + "cell_type": "code", + "execution_count": 30, + "metadata": {}, + "outputs": [], + "source": [ + "top_10 = contagem.most_common(10)" + ] + }, + { + "cell_type": "code", + "execution_count": 32, + "metadata": {}, + "outputs": [], + "source": [ + "textos = [val[0] for val in top_10]\n", + "vals = [val[1] for val in top_10]" + ] + }, + { + "cell_type": "code", + "execution_count": 33, + "metadata": {}, + "outputs": [ + { + "data": { + "text/plain": [ + "" + ] + }, + "execution_count": 33, + "metadata": {}, + "output_type": "execute_result" + }, + { + "data": { + "image/png": "iVBORw0KGgoAAAANSUhEUgAAAXQAAAD8CAYAAABn919SAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADl0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uIDIuMi4yLCBodHRwOi8vbWF0cGxvdGxpYi5vcmcvhp/UCwAAEKlJREFUeJzt3XuMpXV9x/H3Ry5VEOU2EArC0GaL2gtQJxRrvYFYDa2sDRiJl62l3baxqLG0rq1NbGOTpW2q/aO13QplY6yCKIJiEFzAS1qRXVxuollcFyRs2UEhXkjUhW//OM/W6Tqz55yZ88zCj/crmTyX8zzn+53nzPnMM789z7OpKiRJT3xP2dsNSJImw0CXpEYY6JLUCANdkhphoEtSIwx0SWqEgS5JjTDQJakRBrokNWLf5Sx2+OGH1/T09HKWlKQnvE2bNj1YVVPDtlvWQJ+enmbjxo3LWVKSnvCS3DPKdg65SFIjDHRJaoSBLkmNMNAlqREGuiQ1wkCXpEYY6JLUCANdkhphoEtSI5b1StGlmF5zde81tq09s/caktQXz9AlqRFDAz3JCUk2z/n6bpK3JTk0yXVJtnTTQ5ajYUnS/IYGelV9vapOqqqTgOcBjwBXAGuADVW1AtjQLUuS9pJxh1xOB75RVfcAZwHru/XrgZWTbEySNJ5xA/21wIe7+SOrajtANz1ivh2SrE6yMcnG2dnZxXcqSdqjkQM9yf7Aq4CPjlOgqtZV1UxVzUxNDb0/uyRpkcY5Q38lcEtVPdAtP5DkKIBuumPSzUmSRjdOoJ/LT4ZbAK4CVnXzq4ArJ9WUJGl8IwV6kgOAM4CPz1m9FjgjyZbusbWTb0+SNKqRrhStqkeAw3Zb920Gn3qRJD0OeKWoJDXCQJekRhjoktQIA12SGmGgS1IjDHRJaoSBLkmNMNAlqREGuiQ1wkCXpEYY6JLUCANdkhphoEtSIwx0SWqEgS5JjTDQJakRBrokNcJAl6RGGOiS1AgDXZIaMVKgJzk4yeVJvpbkriTPT3JokuuSbOmmh/TdrCRpYaOeof8TcE1VPRs4EbgLWANsqKoVwIZuWZK0lwwN9CTPAF4EXARQVT+qqoeBs4D13WbrgZV9NSlJGm7fEbb5OWAW+I8kJwKbgLcCR1bVdoCq2p7kiPl2TrIaWA1w7LHHTqTp5Ta95urea2xbe2bvNSS1bZQhl32BXwXeX1UnAz9gjOGVqlpXVTNVNTM1NbXINiVJw4wS6PcB91XVTd3y5QwC/oEkRwF00x39tChJGsXQQK+q/wG+leSEbtXpwFeBq4BV3bpVwJW9dChJGskoY+gA5wMfSrI/sBV4E4NfBpclOQ+4FzinnxYlSaMYKdCrajMwM89Dp0+2HUnSYnmlqCQ1wkCXpEYY6JLUCANdkhphoEtSIwx0SWqEgS5JjTDQJakRBrokNcJAl6RGGOiS1AgDXZIaYaBLUiMMdElqhIEuSY0w0CWpEQa6JDXCQJekRhjoktSIkf5P0STbgO8BjwI7q2omyaHApcA0sA14TVU91E+bkqRhRgr0zkur6sE5y2uADVW1NsmabvkdE+1OTK+5uvca29ae2XsNSf1bypDLWcD6bn49sHLp7UiSFmvUQC/g2iSbkqzu1h1ZVdsBuukRfTQoSRrNqEMuL6iq+5McAVyX5GujFuh+AawGOPbYYxfRoiRpFCOdoVfV/d10B3AFcArwQJKjALrpjgX2XVdVM1U1MzU1NZmuJUk/ZWigJzkwyUG75oGXA3cAVwGrus1WAVf21aQkabhRhlyOBK5Ismv7/6yqa5LcDFyW5DzgXuCc/trU3uAnbKQnlqGBXlVbgRPnWf9t4PQ+mpIkjc8rRSWpEQa6JDXCQJekRhjoktQIA12SGmGgS1IjDHRJaoSBLkmNMNAlqREGuiQ1wkCXpEYY6JLUCANdkhphoEtSIwx0SWqEgS5JjTDQJakRBrokNcJAl6RGGOiS1IiRAz3JPkm+kuRT3fLxSW5KsiXJpUn2769NSdIw45yhvxW4a87yhcB7q2oF8BBw3iQbkySNZ6RAT3IMcCbwgW45wGnA5d0m64GVfTQoSRrNqGfo7wP+HHisWz4MeLiqdnbL9wFHT7g3SdIYhgZ6kt8CdlTVprmr59m0Fth/dZKNSTbOzs4usk1J0jCjnKG/AHhVkm3ARxgMtbwPODjJvt02xwD3z7dzVa2rqpmqmpmamppAy5Kk+QwN9Kp6Z1UdU1XTwGuB66vqdcANwNndZquAK3vrUpI01FI+h/4O4O1J7mYwpn7RZFqSJC3GvsM3+YmquhG4sZvfCpwy+ZYkSYvhlaKS1AgDXZIaYaBLUiPGGkOXlsv0mqt7r7Ft7Zm915CWk2foktQIA12SGmGgS1IjDHRJaoSBLkmN8FMu0m78hI2eqDxDl6RGGOiS1AgDXZIaYaBLUiMMdElqhIEuSY0w0CWpEQa6JDXCQJekRhjoktSIoYGe5KlJvpzk1iR3Jvnrbv3xSW5KsiXJpUn2779dSdJCRjlD/yFwWlWdCJwEvCLJqcCFwHuragXwEHBef21KkoYZGug18P1ucb/uq4DTgMu79euBlb10KEkayUhj6En2SbIZ2AFcB3wDeLiqdnab3Acc3U+LkqRRjBToVfVoVZ0EHAOcAjxnvs3m2zfJ6iQbk2ycnZ1dfKeSpD0a61MuVfUwcCNwKnBwkl33Uz8GuH+BfdZV1UxVzUxNTS2lV0nSHozyKZepJAd3808DXgbcBdwAnN1ttgq4sq8mJUnDjfI/Fh0FrE+yD4NfAJdV1aeSfBX4SJL3AF8BLuqxT0nSEEMDvapuA06eZ/1WBuPpkqTHAa8UlaRGGOiS1AgDXZIaYaBLUiMMdElqhIEuSY0w0CWpEQa6JDXCQJekRhjoktQIA12SGmGgS1IjRrnboqRlMr3m6t5rbFt7Zu81tHd4hi5JjTDQJakRBrokNcJAl6RGGOiS1AgDXZIaYaBLUiOGBnqSZyW5IcldSe5M8tZu/aFJrkuypZse0n+7kqSFjHKGvhP406p6DnAq8OYkzwXWABuqagWwoVuWJO0lQwO9qrZX1S3d/PeAu4CjgbOA9d1m64GVfTUpSRpurDH0JNPAycBNwJFVtR0GoQ8cscA+q5NsTLJxdnZ2ad1KkhY0cqAneTrwMeBtVfXdUferqnVVNVNVM1NTU4vpUZI0gpECPcl+DML8Q1X18W71A0mO6h4/CtjRT4uSpFEMvdtikgAXAXdV1T/OeegqYBWwtpte2UuHkpbF3r7TY9/1nwx3mRzl9rkvAN4A3J5kc7fuLxgE+WVJzgPuBc7pp0VJ0iiGBnpVfRHIAg+fPtl2JEmL5ZWiktQIA12SGmGgS1IjDHRJaoSBLkmNMNAlqREGuiQ1wkCXpEYY6JLUiFEu/ZekprVyHxnP0CWpEQa6JDXCQJekRhjoktQIA12SGmGgS1IjDHRJaoSBLkmNMNAlqRFDAz3JxUl2JLljzrpDk1yXZEs3PaTfNiVJw4xyhn4J8Ird1q0BNlTVCmBDtyxJ2ouGBnpVfR74zm6rzwLWd/PrgZUT7kuSNKbFjqEfWVXbAbrpEZNrSZK0GL3/o2iS1Uk2Jtk4OzvbdzlJetJabKA/kOQogG66Y6ENq2pdVc1U1czU1NQiy0mShllsoF8FrOrmVwFXTqYdSdJijfKxxQ8D/w2ckOS+JOcBa4EzkmwBzuiWJUl70dD/saiqzl3godMn3IskaQm8UlSSGmGgS1IjDHRJaoSBLkmNMNAlqREGuiQ1wkCXpEYY6JLUCANdkhphoEtSIwx0SWqEgS5JjTDQJakRBrokNcJAl6RGGOiS1AgDXZIaYaBLUiMMdElqhIEuSY1YUqAneUWSrye5O8maSTUlSRrfogM9yT7APwOvBJ4LnJvkuZNqTJI0nqWcoZ8C3F1VW6vqR8BHgLMm05YkaVxLCfSjgW/NWb6vWydJ2gtSVYvbMTkH+M2q+v1u+Q3AKVV1/m7brQZWd4snAF9ffLtjORx4cJlqPd7qW9va1m6r9nFVNTVso32XUOA+4Flzlo8B7t99o6paB6xbQp1FSbKxqmaWu+7job61rW3tdmvvyVKGXG4GViQ5Psn+wGuBqybTliRpXIs+Q6+qnUn+BPgMsA9wcVXdObHOJEljWcqQC1X1aeDTE+pl0pZ9mOdxVN/a1rZ2u7UXtOh/FJUkPb546b8kNcJA1xNekncnuWAv1D0yyQ1JrknyruWu/2S1t17vvV17FEsaQ5eezKrqAeCle7sPaZcmz9CTvD7Jl5NsTvJv3X1nJl3jL7sbk302yYeTXJDkxiQz3eOHJ9nWze+T5O+T3JzktiR/OOl+ujpvT3JH9/W2PmrsofYnkmxKcmd3MVnf9f7v+DO4YI0kP9+dLW9K8oUkz55QrekkdyX59+77uzbJ05L8Qfea3prkY0kO6LY/LsmG7rXekOTYMeu9sdv31iQfXOj5klyS5P3dXwlbk7w4ycVdr5fMeb5zk9ze/VxcuIjv/6feT0m+n+TC7lh/Nskp3c//1iSvGrfGCD3M93rPe/yXqfZJSb7UvSZXJDmkj9pjq6qmvoDnAJ8E9uuW/wV444RrPA+4HTgAeAZwN3ABcCMw021zOLCtm18NvKub/xlgI3B8Tz0dCDwduBM4eRmP+6Hd9GnAHcBhPdZa6PhvAFZ02/wacP2E6k0DO4GTuuXLgNfP/R6B9wDnd/OfBFZ1878HfGKMWr/I4Grqw3cd14WeD7iEwT2UwuA+St8FfpnBidom4CTgZ4F7gSkGf5FfD6wco595309AAa/s1l0BXAvsB5wIbF6m13ve479MtW8DXtxt8zfA+/r6eR/nq8Uhl9MZvAg3J4FBwOyYcI0XAldU1SMASYZdUPVy4FeSnN0tPxNYAXxzgj39RtfTD7qePt71+ZUJ1tiTtyR5dTf/LAbf37d7qjXf8X8q8OvAR7vXHQa/PCflm1W1uZvfxCDkfynJe4CDGfwS/Uz3+POB3+nmPwj83Rh1TgMur6oHAarqO0n29HyfrKpKcjvwQFXdDpDkzq7H44Abq2q2W/8h4EXAJ0bsZ6H304+Aa7ptbgd+WFU/7vqYHuP7HcVC77eFjn/ftQ8EDq6qz3XbrAc+2kPtsbUY6AHWV9U7e64z3+c9d/KTYayn7tbT+VXVxw/c3Bp7RZKXAC8Dnl9VjyS5kf///fdh9+P/FODhqjqpp3o/nDP/KINgu4TB2e6tSX4XeMkC+47z2eCMsP3cx3f19dhuPT7G4P29c4zaC/XzU++nJBdUd3o6t3ZVPZakj1yZ75hcwmjHv4/aj0stjqFvAM5OcgRAkkOTHDfhGp8HXt2Nox4E/Ha3fhuDsxmAs+ds/xngj5Ps1/X0C0kO7KGnlUkO6J771cAXJlxjIc8EHurC/NnAqT3Xm+/4PwJ8M4ObxpGBE3vu4yBge/e6vm7O+v9icCsMuvVfHOM5NwCvSXIYDH5+l/h8NwEvzuDfdPYBzgU+N2Sf3fvp+/00zELvt4WOf9+1fwA8lOSF3TZvYLxj2pvmztCr6qsZfITs2iRPAX4MvBm4Z4I1bklyKbC5e95dwfkPwGUZ3Hny+jm7fIDBn6G3ZPB36yywclL9zOnpEuDLu2pW1XINt1wD/FGS2xiM/36pz2J7OP6vA97fvf77MRhfvrXHVv6KQWDew2DY4aBu/VuAi5P8GYPX+k2jPmFV3Znkb4HPJXmUwZDZUp5ve5J3AjcwONv+dFVdOcb+C72fls0eXu+Fjv9y1F4F/Gv3D7FbGeM16ZNXik5AkncD36+qf9jbvUh68mpxyEWSnpQ8Q5ekRniGLkmNMNAlqREGuiQ1wkCXpEYY6JLUCANdkhrxv0DWaEjedm5lAAAAAElFTkSuQmCC\n", + "text/plain": [ + "
" + ] + }, + "metadata": {}, + "output_type": "display_data" + } + ], + "source": [ + "bar(textos, vals)" + ] + } + ], + "metadata": { + "kernelspec": { + "display_name": "Python 3", + "language": "python", + "name": "python3" + }, + "language_info": { + "codemirror_mode": { + "name": "ipython", + "version": 3 + }, + "file_extension": ".py", + "mimetype": "text/x-python", + "name": "python", + "nbconvert_exporter": "python", + "pygments_lexer": "ipython3", + "version": "3.6.5" + } + }, + "nbformat": 4, + "nbformat_minor": 2 +} diff --git a/2018-07-07/tabacaria.txt b/2018-07-07/tabacaria.txt new file mode 100644 index 0000000..aa7d23f --- /dev/null +++ b/2018-07-07/tabacaria.txt @@ -0,0 +1,189 @@ +Tabacaria + +Não sou nada. +Nunca serei nada. +Não posso querer ser nada. +À parte isso, tenho em mim todos os sonhos do mundo. + +Janelas do meu quarto, +Do meu quarto de um dos milhões do mundo que ninguém sabe quem é +(E se soubessem quem é, o que saberiam?), +Dais para o mistério de uma rua cruzada constantemente por gente, +Para uma rua inacessível a todos os pensamentos, +Real, impossivelmente real, certa, desconhecidamente certa, +Com o mistério das coisas por baixo das pedras e dos seres, +Com a morte a pôr humidade nas paredes e cabelos brancos nos homens, +Com o Destino a conduzir a carroça de tudo pela estrada de nada. + +Estou hoje vencido, como se soubesse a verdade. +Estou hoje lúcido, como se estivesse para morrer, +E não tivesse mais irmandade com as coisas +Senão uma despedida, tornando-se esta casa e este lado da rua +A fileira de carruagens de um comboio, e uma partida apitada +De dentro da minha cabeça, +E uma sacudidela dos meus nervos e um ranger de ossos na ida. + +Estou hoje perplexo como quem pensou e achou e esqueceu. +Estou hoje dividido entre a lealdade que devo +À Tabacaria do outro lado da rua, como coisa real por fora, +E à sensação de que tudo é sonho, como coisa real por dentro. + +Falhei em tudo. +Como não fiz propósito nenhum, talvez tudo fosse nada. +A aprendizagem que me deram, +Desci dela pela janela das traseiras da casa, +Fui até ao campo com grandes propósitos. +Mas lá encontrei só ervas e árvores, +E quando havia gente era igual à outra. +Saio da janela, sento-me numa cadeira. Em que hei-de pensar? + +Que sei eu do que serei, eu que não sei o que sou? +Ser o que penso? Mas penso ser tanta coisa! +E há tantos que pensam ser a mesma coisa que não pode haver tantos! +Génio? Neste momento +Cem mil cérebros se concebem em sonho génios como eu, +E a história não marcará, quem sabe?, nem um, +Nem haverá senão estrume de tantas conquistas futuras. +Não, não creio em mim. +Em todos os manicómios há doidos malucos com tantas certezas! +Eu, que não tenho nenhuma certeza, sou mais certo ou menos certo? +Não, nem em mim... +Em quantas mansardas e não-mansardas do mundo +Não estão nesta hora génios-para-si-mesmos sonhando? +Quantas aspirações altas e nobres e lúcidas - +Sim, verdadeiramente altas e nobres e lúcidas -, +E quem sabe se realizáveis, +Nunca verão a luz do sol real nem acharão ouvidos de gente? +O mundo é para quem nasce para o conquistar +E não para quem sonha que pode conquistá-lo, ainda que tenha razão. +Tenho sonhado mais que o que Napoleão fez. +Tenho apertado ao peito hipotético mais humanidades do que Cristo, +Tenho feito filosofias em segredo que nenhum Kant escreveu. +Mas sou, e talvez serei sempre, o da mansarda, +Ainda que não more nela; +Serei sempre o que não nasceu para isso; +Serei sempre só o que tinha qualidades; +Serei sempre o que esperou que lhe abrissem a porta ao pé de uma parede sem porta +E cantou a cantiga do Infinito numa capoeira, +E ouviu a voz de Deus num poço tapado. +Crer em mim? Não, nem em nada. +Derrame-me a Natureza sobre a cabeça ardente +O seu sol, a sua chuva, o vento que me acha o cabelo, +E o resto que venha se vier, ou tiver que vir, ou não venha. +Escravos cardíacos das estrelas, +Conquistámos todo o mundo antes de nos levantar da cama; +Mas acordámos e ele é opaco, +Levantámo-nos e ele é alheio, +Saímos de casa e ele é a terra inteira, +Mais o sistema solar e a Via Láctea e o Indefinido. + +(Come chocolates, pequena; +Come chocolates! +Olha que não há mais metafísica no mundo senão chocolates. +Olha que as religiões todas não ensinam mais que a confeitaria. +Come, pequena suja, come! +Pudesse eu comer chocolates com a mesma verdade com que comes! +Mas eu penso e, ao tirar o papel de prata, que é de folhas de estanho, +Deito tudo para o chão, como tenho deitado a vida.) + +Mas ao menos fica da amargura do que nunca serei +A caligrafia rápida destes versos, +Pórtico partido para o Impossível. +Mas ao menos consagro a mim mesmo um desprezo sem lágrimas, +Nobre ao menos no gesto largo com que atiro +A roupa suja que sou, sem rol, pra o decurso das coisas, +E fico em casa sem camisa. + +(Tu, que consolas, que não existes e por isso consolas, +Ou deusa grega, concebida como estátua que fosse viva, +Ou patrícia romana, impossivelmente nobre e nefasta, +Ou princesa de trovadores, gentilíssima e colorida, +Ou marquesa do século dezoito, decotada e longínqua, +Ou cocote célebre do tempo dos nossos pais, +Ou não sei quê moderno - não concebo bem o quê -, +Tudo isso, seja o que for, que sejas, se pode inspirar que inspire! +Meu coração é um balde despejado. +Como os que invocam espíritos invocam espíritos invoco +A mim mesmo e não encontro nada. +Chego à janela e vejo a rua com uma nitidez absoluta. +Vejo as lojas, vejo os passeios, vejo os carros que passam, +Vejo os entes vivos vestidos que se cruzam, +Vejo os cães que também existem, +E tudo isto me pesa como uma condenação ao degredo, +E tudo isto é estrangeiro, como tudo.) + +Vivi, estudei, amei, e até cri, +E hoje não há mendigo que eu não inveje só por não ser eu. +Olho a cada um os andrajos e as chagas e a mentira, +E penso: talvez nunca vivesses nem estudasses nem amasses nem cresses +(Porque é possível fazer a realidade de tudo isso sem fazer nada disso); +Talvez tenhas existido apenas, como um lagarto a quem cortam o rabo +E que é rabo para aquém do lagarto remexidamente. + +Fiz de mim o que não soube, +E o que podia fazer de mim não o fiz. +O dominó que vesti era errado. +Conheceram-me logo por quem não era e não desmenti, e perdi-me. +Quando quis tirar a máscara, +Estava pegada à cara. +Quando a tirei e me vi ao espelho, +Já tinha envelhecido. +Estava bêbado, já não sabia vestir o dominó que não tinha tirado. +Deitei fora a máscara e dormi no vestiário +Como um cão tolerado pela gerência +Por ser inofensivo +E vou escrever esta história para provar que sou sublime. + +Essência musical dos meus versos inúteis, +Quem me dera encontrar-te como coisa que eu fizesse, +E não ficasse sempre defronte da Tabacaria de defronte, +Calcando aos pés a consciência de estar existindo, +Como um tapete em que um bêbado tropeça +Ou um capacho que os ciganos roubaram e não valia nada. + +Mas o dono da Tabacaria chegou à porta e ficou à porta. +Olhou-o com o desconforto da cabeça mal voltada +E com o desconforto da alma mal-entendendo. +Ele morrerá e eu morrerei. +Ele deixará a tabuleta, e eu deixarei versos. +A certa altura morrerá a tabuleta também, e os versos também. +Depois de certa altura morrerá a rua onde esteve a tabuleta, +E a língua em que foram escritos os versos. +Morrerá depois o planeta girante em que tudo isto se deu. +Em outros satélites de outros sistemas qualquer coisa como gente +Continuará fazendo coisas como versos e vivendo por baixo de coisas como tabuletas, +Sempre uma coisa defronte da outra, +Sempre uma coisa tão inútil como a outra, +Sempre o impossível tão estúpido como o real, +Sempre o mistério do fundo tão certo como o sono de mistério da superfície, +Sempre isto ou sempre outra coisa ou nem uma coisa nem outra. + +Mas um homem entrou na Tabacaria (para comprar tabaco?), +E a realidade plausível cai de repente em cima de mim. +Semiergo-me enérgico, convencido, humano, +E vou tencionar escrever estes versos em que digo o contrário. + +Acendo um cigarro ao pensar em escrevê-los +E saboreio no cigarro a libertação de todos os pensamentos. +Sigo o fumo como uma rota própria, +E gozo, num momento sensitivo e competente, +A libertação de todas as especulações +E a consciência de que a metafísica é uma consequência de estar mal disposto. + +Depois deito-me para trás na cadeira +E continuo fumando. +Enquanto o Destino mo conceder, continuarei fumando. + +(Se eu casasse com a filha da minha lavadeira +Talvez fosse feliz.) +Visto isto, levanto-me da cadeira. Vou à janela. + +O homem saiu da Tabacaria (metendo troco na algibeira das calças?). +Ah, conheço-o: é o Esteves sem metafísica. +(O dono da Tabacaria chegou à porta.) +Como por um instinto divino o Esteves voltou-se e viu-me. +Acenou-me adeus gritei-lhe Adeus ó Esteves!, e o universo +Reconstruiu-se-me sem ideal nem esperança, e o dono da Tabacaria sorriu. + +Álvaro de Campos, in "Poemas" +Heterónimo de Fernando Pessoa \ No newline at end of file