2024/07/13
LangSmith と LangGraph がアップデートされたようです。
当サイトでLangChain のいろいろをご紹介するのは難しい(面倒な)ので公式からのアナウンスのみ….。LangChain についてはエージェントがらみで、LlamaIndex についてがRAG がらみでやるかもしれません….?
ところで、07/19付けでGTP-4o mini がリリースされています(GPT-3.5の後継として無料ユーザーとChatGPT Plusのユーザーに提供開始)
2024/02/25
ラズパイ5(8GB)で、日本語対応の7B(70億)パラメータのLLMを量子化して使ってみる
Appendix をいくつか追記しました。
2023/11/01
エッジAIの展開に本気なEdge Impulse からのアナウンスです。
Edge Impulse はNVIDIA と連携してTAO を使ったエッジAI用モデルの作成方法を教えてくれるWebinar を2023 年 11 月 9 日午前 9 時(太平洋標準時)に公開するそうです(日本時間だと夕方)。興味のある方は以下からregistして参加しましょう。
Fast Track AI to the Edge with NVIDIA TAO & Edge Impulse
ちなみに、NVIDIA TAO というのはAI アプリケーションやサービスの開発を行う AI モデル適応プラットフォームのことで、転移学習などに使う事前学習済モデルを山ほど持ってるそうです。
TAO を自前で動かそうとすると、そこそこのPCが必要になります。で、そんなPC持ってない方はクラウドに頼みます、Google COLAB を使ってみましょう。
注:2023/12/06現在、ColabのOSはUbuntu 22.04.3 LTSになっていて、TAOを実行しようとすると多くの不具合が発生します。何らかの対処がなされるまで、トライアルは停止します。
TAO ToolKit って何?を日本語で見てみる
余談になりますが、NVIDIA のJetson のようなエッジにもいよいよ生成AIの波が……(ただしOrinのようなAmpereアーキテクチャクラスのGPUが必要なようですが)。
Jetson のファミリーは呼び方の難しいのが多いです。
Xavier:シャビエルやザビエルではなく「エグゼビア」
Orin:オリンやオラインではなく「オーリン」
2023/06/12
誤記脱字が多かったので修正しました。
Pi Pico (W) に有機EL (OLED) ディスプレイ:Arduino IDE
2023/04/18
Kaggleで新しいコンペがローンチされています。
Image Matching Challenge 2023
何をするかというとStructure from Motion (SfM)の新しいモデルを構築してくれということらしいです。
出所はGoogle + αです。
SfMは一般的にはカメラの複数ビューから物体の3Dモデルを構成するというものですが、VisualSLAMなどではカメラを使って周囲のシーン(scene)の3Dマップの構成に使われていますね。
精度の高い再構築ができれば、あなたのモデルはGoogleマップの機能に採用されるかも…。
2023/04/06
DAIR.AIのPrompt Engineering Guideの日本語版「プロンプトエンジニアリングガイド」が公開されています。
WisteriaHill はプロンプトエンジニアリング自体はモデルやアルゴリズムの進化によっていずれそのうち無くなるか形態を変えるだろうぐらいに考えていますが、現時点では「大規模言語モデル(LLMs)の能力と限界をより理解する」ためのものと考えれば納得がいきます。
2023/03/02
国交省のPLATEAU のSDK でUnity とUnreal Engine のバージョンが公開されています。Windows、macOS、iOS、Android各プラットフォームに対応しているそうです。
2023/03/01
Kaggle で新しいコンペティション(Stable Diffusion – Image to Prompts)がリリースされています。ちょっと不思議な、でも面白いテーマです。
昨今の生成AI におけるプロンプト・エンジニアリングは「プロンプトー>画像」という方向になりますが、今回のコンペは「画像ー>プロンプト」を予測するというものです。チャレンジしてみてはいかがでしょうか?
2023/02/27
Stable Diffusion という画像生成AI がどのような要素から成り立っているか説明してくれるツール「SD Toolset」が公開されています。全体を俯瞰するカテゴリーからより詳細なカテゴリーまでが円環図で構成されています。日本語化するとこんな感じ。
例えば、右下の「Editing Composition」をクリックすると、これを説明するカテゴリー群が新しい円環図で再構成されて表示されます。Img2Img をクリックすると、それがどんなものか説明してくれます。
Stable Diffusion の使い方やモデルを解説してくれているわけではないですが、どういう技術要素で成り立っているのか俯瞰できます。ただ、ここでも画像生成におけるノイズの付加・除去について説明されていますが拡散モデル においてノイズは必ずしも必要ないんじゃない?という話もあります、どうなんでしょう?
2023/02/26
Stable Diffusion をGoogle Colab で使ってみる を修正
実行時エラーを修正しました。Stable Diffusion 自体のアップデートが速いので実行コードはすぐに古くなります。マメに動作するか確認する必要があるようです。
2023/02/11
ChatGPT が評判ですが、どうもこのAI、よくしゃべる割には与太話も得意なようで….。それにデータも2021年以前のもので学習したらしく、それ以降の知識がちとあやうい…。
出典がはっきりしててデータのアップデートも欲しい方には、Perplexity.ai はいかがでしょう?
質問などを投げれば、source付きで回答してくれますし、Chromeの拡張機能にも対応してます。日本語苦手らしいので、DeepLやGoogle翻訳などとコミでやってみましょう。
2022/12/26
昨今話題のChatGPT の非公式デスクトップアプリが公開されていました。
年末年始はこれで遊んでみます。
Windows、Mac、Linux 対応です。インストールにはOpenAI のアカウントが必要なようです。アカウントが未だの方はChatGPTのサイトでSign up して取得しておきましょう。
日本語にも対応しています。こんな感じです。
2023/03/23 アップデートされました。
簡単なコードを聞いてみました(プロンプト・プログラミングというやつです)。コメント付きで教えてくれます。
2022/10/28
2022年はMidjourneyやStable Diffusionでもういいかなと思いきや、まだこの手があるようです。拡散モデルを使って、画像をプロンプトで編集しちゃいます。
Google のColab でNVIDIA Tesla T4 などを使ってお試しできるようです。
Stable Diffusion のモデルでFine Tuning を行うので、Hugging Face のアカウントとアクセストークンを取得しておく必要があります。このページ参照
Colab でサンプル(Imagic_Stable_Diffusion.ipynb)を実行する場合は、鳥の画像を1枚アップロード用に準備しておきましょう。
サンプルのプロンプト「A bird spreading wings」はこんな感じで実行されました。
また、プロンプト・テキストを使った画像や動画の自動加工にはText2LIVE というのもあるようです、参考までに。
2022/10/01
プロンプト・テキストのVideo 版が出始めました。こりゃすごいとしか言いようがないです。
Meta の Make-A-Video
2022/09/09
rinna がStable Diffusion の日本語版を公開していました。日本語キャプション付きの画像を約1億枚追加で学習させたものだそうで、日本語圏の固有名詞や和製英語、オノマトベ(擬音、擬態語など)などを反映した画像も生成できるようです。
Colab でやってみましたが確かにプロンプトに日本語が使えますね。
Hugging Face へのログインやアクセストークンはStable Diffusion をGoogle Colab で使ってみるをご参照
2022/09/02
Stable Diffusion をGoogle Colab で使ってみるをアップデートしました。
Image-To-Image を膨らませています。StableDiffusionImg2ImgPipelineや、In-paintingについても少々。
Stable Diffusion にも下記のDALL-E でやっているOut-Painting が可能なEdition があるようです。
2022/09/01
昨今世情を騒がせているMidjourney やStable Diffusion ですが、そのモデル(Latent Diffusion Model)の本家筋にあたるDALL-E がすごいものを公開しています。Outpainting です。
下の画像はフェルメールの「真珠の耳飾りの少女」を拡張したものです。TIMELAPSEのボタンをクリックすると制作工程が分かります。
誰もが一度は思う(多分)、その絵の中に入ってみたい!、への第一歩かな?VR用フォーマットに変換できれば360度をHMDで体験できるようになるんじゃないでしょうか。
しかし見ていくうちに、この日常の雰囲気の中で、フェルメールの少女の持つ一種の神秘性が次第に無くなっていくのが面白いですね。
2022/08/23
またtext-to-image界隈で画像生成AIが公開されています。Stability AiのStable Diffusionです。世間ではここ1ケ月ばかり、Midjourneyの話題で盛り上がっていますが、このStable Diffusionで新しいステージに入った感がします。
これまでのこの手のサービスはクラウドで提供されていましたが、これはモデルもコードも公開されていて(Colab Notebook)、そこそこのGPU(例:NVIDIA RTX-30xx)を搭載したマシンを持っていればローカルでも実行できるようです。
アカウントを作ればDream Studio betaでデモを実行できます。もしかしたらMidjourneyより我々の要求仕様に近いかもしれませんね。
以下の画像はプロンプト・テキストを発行して、ものの数秒で生成されました、HuggingFace のデモよりはるかに速いです。
Diffusion Models がGANに勝ったと主張する論文があるそうです
2022/08/15
kaggle で久々のサッカーねたのコンペが開始されていました。DFL-Bundesliga Data Shootout
ビデオなどの映像の中からパスやスローイン、クロスなどのイベントを分類するモデルを作りましょうというのが目的です。
DFLはドイツのブンデスリーガとリーガ2を管理する組織だそうです。プライズは$25000。チャレンジしてみてはいかがでしょうか。
2022/07/28
DeepMind の「PLATO」や、コロンビア大学の記事はAIについての知見というかビジョンを再認させてくれますね。
また人工知能学会の「AI哲学マップ」の関連テーマを見ると「え!ここでベルクソンですか?」という驚きがちょっとありますが、そうかもしれない…という感じはします。「創造的進化」を読みたくなるかもしれませんが、いやいや、ここは「物質と記憶」でしょう(彼の経歴のノーベル文学賞に目が行きがちですが、ベルクソンの根っこは、数学者ですし…)。
2022/07/18
指示した文章から画像を生成するAIとしてOpenAI のDALL-E(2) が有名ですが、その縮小版ともいえるcraiyonが公開されています。当初DALL-E miniと名乗っていたようですがOpenAIから「紛らわしいので名前変えてくれ」と言われてcraiyonとなったそうです。
「cat superman」で画像を生成してみます(2分くらいでいけるよ….と出ますが本当にそのくらいで生成されました)。
右ボタンでDiscord アカウント作成後、左ボタンでベータ版にログイン
左ペインの「NEWCOMER ROOMS」のどれかを選択
中央下の十字ボタンをクリックして、「スラッシュコマンドを使用」を選択
/imagine prompt を選択、どんな絵を描くのか指示して実行
2022/07/06
TurtleBot3(Waffle)でカメラ機能の確認とYOLOによる物体認識
ページの最後に、Webカメラを使った場合のYOLOによる物体認識の項目を追加しました。
2022/04/03
これはすごいですね。
自ら走り方を学んで全力疾走! AIで“進化”するチーター型ロボットの実力(動画あり)
以前アナウンスした動物を模倣して4脚ロボットを学習させる!は四足歩行ロボットの「走り方」を模倣学習していましたが、これは強化学習を使って「走り方」を自分で学習しています。
MIT のMini Cheetah が使われていますが、Boston Dynamics のSpotもこの速度は出せていないんじゃないでしょうか?
モデルが公開されたらGazeboでシミュレーションできたらいいですね。
2022/03/08
ラズパイ4B + ODAS_ROS でReSpeaker 4-Mic Array for Raspberry Piを使ってみるをアップデートしました。
configuration.cgf の修正ファイルを更新しました。Rviz でsst_posesを使った音源追跡がちょっとましになった気がします(^^)。
2022/01/25
ラズパイ4B にROS1(Noetic)をインストールをアップデートしました。
ROS1 (Noetic) のros-noetic-desktop-fullはUbuntu Server 20.04.3 LTSにはインストールできないようですので、変更しました。
20.04.3にインストールできるのはros-noetic-desktopで、この場合、Gazeboは後でインストールする必要があります。
2022/01/12
SWITCHSCIENCEでOAK-D-LITE OpenCV DepthAIカメラの販売が開始されました。また、OAK-D OpenCV DepthAIカメラの方も販売が再開されています。
エッジAIカメラとしてはかなりの優れものです。イメージプロセスユニットはintelのMovidius NCS2 で使われているものと同じっぽいですね。グラフバイナリを使えば他のモデルもアップロードできるのかな?
Mini Pupperを相当賢くしてくれるそうです。
固定焦点版と自動焦点版の2種類ありますが、ドローンやMini Pupper で使う場合は、固定焦点版の方を選びましょう。
2022/01/08
昨年ご紹介した4足歩行プラットフォームMini Pupper の日本版プロジェクトが昨年末クリスマス頃にMakuakeでオープンしていました(~2022/02/27)。「ミニぷぱ」と読ませてますが、英語発音は「ミニ ぱぷ」に近い? ー> ここ参照
リサーチ・キット版とコンプリート・キット版、組み立て完成版の3パターンあります。Mini Pupper はオープンソースでCADデータやBOM情報なども公開されていますが、PCBA、バッテリ、カスタマイズ・サーボ、カーボンファイバ、LCDディスプレイなどはどうしたって自作は困難です。買わんとしょうがないです。
DIYしたい方には、リサーチ・キット版なら49500 円から。コンプリート・キット版は64900円から。一般販売の予定価格より40%弱安い値段で手に入るようです。
LiDARでSLAMする場合は27500円でモジュール追加。でも、深度カメラも載せられるので、がんばればDepthやVisual SLAM もいけるんじゃないでしょうか?制御はPS4コントローラを使うようですが、カメラ(目)を与えれば、自律歩行も夢じゃないかも(^^)。また、現Pupperには「耳」や「口」がないみたい。マイクやスピーカーをつけてやると何ができるようになるか?やってみると面白いでしょうね。
ところで、4足歩行ロボットについて以下のような記事がアップされていました。興味深いです。よろしければどうぞ。
2021/12/22
東工大が「機械学習帳」なるものを無料公開中。
機械学習の基礎中の基礎の実装をPythonで学べます。
使っているライブラリもこれまた基本中の基本のものばかりなので、WindowsでもMacでもLinuxでもOKです。
この際だからPythonもしっかり勉強したい向きには京大の公開講座(コラム編)がお薦めです。
2021/12/21
7月頃に、「あのSEGAが数学資料150ページ超を無料公開しています(PDF版)」ってアナウンスしましたが、今回は「クォータニオンとは何ぞや?:基礎線形代数講座」が公開されています。
全8講で、ゲーム開発のベースになっている数学って何?を知るのに必須の内容ですが、AIやVRをアプリレベルで実装するのにも役立ちそうです。
2021/11/18
OpenAIのGPT-3を利用するためのウェイトリストが解除されたそうです。
Japanはサポートカントリーなので、早速サインアップして、使ってみましょう(^^)。
2021/10/27
自作できるエッジAI用のプラットフォームとして、車輪(wheel)や無限軌道(キャタピラ)を使ったものが一般的でした。UAV(ドローン)もありますが、あまり一般的とは言えません。2足歩行ロボットはやや高価です。で、ここに4足歩行が加わりそうです。ボストンダイナミクス社製のSpotを小型にした感じのスタンフォード大学の「Mini Pupper」です。OSSとしてGitHubで公開されています。機械系の駆動エンジンには独自サーボモーターが使われていますが、結構複雑な動きをさせています。下記のEvaの自由度は6でしたが、Mini Pupperは12自由度で稼働するそうです。EvaのStewart Platformで使われているパーツが流用できそうな気が….(ちなみにSONYのaiboの胴体部分の自由度は13….Pupperはおすわりができないってこと?)。
ROS + OpenCV + ラズパイ4Bで動いています。SLAMを使った自己位置推定もやってます(多分VisualではなくLiDAR <ー お尻のところに乗っかている黒いパーツ、でも深度カメラも搭載しているようです….aiboはVisualSLAMを使っています)。
サイズは片手で持てそうに見えますが、両手のひらを広げたくらいの結構大きめのようです。
自作は面倒という方は今ならKickstarterで5万7千円で入手できるそうです。
クラウドファンディングは2021/10/29成立して終了しました。
2021/09/24
arXivにこういう論文がありました。
High-Precision Localization Using Ground Texture(2019/06/26)
システムはMicro-GPSという名で呼ばれているようですが、GPSというよりLPS(Local Positioning System)という感じ(今のところ)。
既存のGPSなどの位置推定の精度をメートルやセンチメートルからミリメートル単位まで落とすのに補完的に使うようです(単体での自己位置推定も可能ですが)。
使っているのはOpenCVなどによる画像の特徴抽出とマッチングですが、地表面テクスチャの独特のデータセットとデータベースの作り方のアイデアが面白いです!位置推定はVSLAMより精度はいいんじゃないでしょうか?
データ処理にはシングルボードコンピュータ(Jetson TX1)とカメラ、LED照明を実装したロボットが使われています。
まだ、特定の地表面テクスチャしか対応していないので汎用性に難があるようですが….。
現状想定エリアは駐車場や空港(滑走路)、屋内のように地表面テクスチャが安定している場所だと思われますが、ミリメートル単位でローカライゼーションが必要な用途って何でしょうね(ルンバ?のようなものや介護支援のようなロボット制御なども想定されているようです)。まあ眼目になるのは地表面を見れば位置推定ができるってことだと思うのですが。
論文ですが、データセットのサンプルとソースも公開されているので、興味のある方は覗いてみましょう。
2021/09/13
画像データの実寸サイズ印刷に記述誤りがあったので修正しました。
もうちょっと詳しい版
2021/08/28
rinnaさんご提供の事前学習モデルがアップデートされました。以前はGPT2-mediumのみでしたが、今回はsmall、xsmall、RoBERTa (BERT)の3種類が追加され、mediumもアップデートされています。
rinnakk/japanese-pretrained-models
2021/08/26
これはちょっとスゴイかもしれない。10万円以下の予算で、ラズパイ+Pythonと3Dプリンター+サーボモーターを使って6種類の表情を表せるOSS版ヒューマノイドロボット「Eva」。これまでのエッジ実装型のAIモデルを使うのに絶好のプラットフォームかも(不気味の谷を完全には超えていない?)。
Facially expressive humanoid robotic face
サーボモーターもしっかり使われています。
でも、ちょっと気になるのは提供されてるCADデータファイルがSLDPRT形式なこと。これってファイルを開くのに、SolidWorksというとってもお高いソフトを使えってこと?うーーむ…..それとも、SLDPRTも受けるよ、という3Dプリント屋さんを探せ…と。
それに部品表を見てて気づいたんだけど、Servo HATのヘッダーピンをハンダ付けしなきゃいけないみたい。電子工作の沼に入りそう。
2021/08/21
さくらインターネットのTellusが駐車場検知ツール「TellusVPL」のα版を無料で提供開始しています。
衛星画像データの活用としてこれまで「ゴルフ場」を探してみよう(検証してみる)とかありましたが、今回は駐車場になりそうなところを探してみる…です。
衛星画像データを使えば植生とか水場のエリアとか検知できますが、今度は空き地?
使ってみましょう。
2021/08/03
まともなGPU無しのWindows PC でトレーニングありの機械学習は無理かな?と思っていました(MacにはM1がある)が、Lobe(Microsoft)がありました。ラズパイでも使えるようですので、これにも注力してみましょう。
2021/07/07
自然言語処理(NLP)のBERTやGPT、画像処理のDALL-Eなどで使われるTransformer って何?とお思いの方。
この方のYoutubeビデオをご覧になると「あぁ、そういうこと!」と得心できます(やや早口ですけど)【忙しい人のため用】。動画の中で紹介されているGNMTモデルについてのYoutubeビデオはこちら。また、機械翻訳のところでたびたび出てくるBLEUスコアについてはコチラを参照。
数式はちょっと…..という方には、SONYのNeural Network Console のYoutubeビデオはどうでしょう?NN Console は実際にSONYのクラウド上で探せば実装もあるかもしれません。
いやいや、やっぱり文章で…..という方は、ここ参照。Attention が「注意」とそのまま訳されてますが、Attention のままのほうがいいです。
2021/07/01
あのSEGAが数学資料150ページ超を無料公開しています(PDF版)。ゲームを開発したい人向けですが、内容はAIやVRを実装したい!って方も読んで損はないです。高校数学や大学教養レベルでいけると思います、クォータニオンなんかは初見の人はオモシロイんじゃないでしょうか。
2021/06/29
非常に気になるアプリケーション2題
ARTIFICIAL LIFE ENVIRONMENT(ALiEn):人工生命のシミュレーションプログラム
Canvas(NVIDIAのAIペイントソフト):川や雲などの要素をペタペタ描いた落書きのようなものをリアルな画に変換するプログラム
どちらも興味深いですが、残念ながらNVIDIAのRTXクラスのGPUを載せたWindowsマシンが必要です。
2021/06/18
TinyMLのEdge Impulse がRaspberry Pi 4 へも対応するようになったもよう。
JetsonNano にも対応しているので、使ってみましょう。
参考:TinyML (chap 1 – 6) このレベルのデバイス(マイクロコントローラ)が想定されているようです。
2021/06/08
protbuf のインストールの項で転記ミスがありましたので修正を実施しました。
Jetson Nano(4GB) でOpenVSLAMを試してみる(1/3)
2021/05/09
若干アップデートしました。
Jetsonからラズパイにメッセージを届けてみる(ROS2/DDS)
2021/03/26
姿勢推定実行時の座標情報の項を修正・追加しました。
Jetson Nanoで学習済みモデルを使って、いろいろやってみる(4-1)姿勢推定(ResNet-18)
2021/03/19
実行環境を変更してみました。
Jetson Nanoで学習済みモデルを使って、いろいろやってみる(4-2)姿勢推定(TensorRT)
2021/02/26
アップデートしました。
Jetson Nanoで学習済みモデルを使って、いろいろやってみる(3)ファインチューニング(MaskR-CNN)
2021/02/10
OpenAIが自然言語処理(NLP)の分野で文書生成AIのGPT-3を発表して以来、これと連動して画像生成する動きが活発になっています。DALL-EやCLIPなどARTとの連動です。ただGPT-3はMicrosoftの制約があるので、これらのコードがすべて公開される可能性は低いかも。それに代わるGPT-Neo(EleutherAIについて)の動きや、活発に創作活動しているHolly Grimm さんの動向など注目していきます。
2021/01/10
SIGNATEのコンペでこういうのがローンチされていました。
オフロード環境等の実走行で得られた画像を領域分割するアルゴリズムを作成するというもの。
スポンサードは防衛装備庁先進技術推進センター。
こんなことをするそうです。
チュートリアルも公開されています。とっかかりやすいですね。
チュートリアルの実行についてはこのページもご参照
2021/01/02
Adobeが2020/12/31をもって「Adobe Flash」のサポートを正式に終了しましたんで、当サイトもカテゴリを削除しました(全然アップデートしてませんでしたけど….)。
皆さんも「今すぐにFlashを削除」しましょう(^^)。
Flashといえば、MacOSがSystem7だったころにFlashの前身の画像アプリ(名前は忘れてしまいました)に感動した思い出だけがあります。
合掌
2020/12/23
SIGNATEでこのようなコンペがローンチされています。
無人航空機(ドローン)の空撮画像を利用し、魚群を自動検知するAIアルゴリズムの作成
昨今は衛星画像より詳細なドローンなどの空撮画像の利用が注目されているようです。
1位になると60万円 + 鰹節 がいただけるそうです。現物支給かぁ、いいっすね。
入賞モデルは、将来的にエッジデバイス(NVIDIA / JETSON AGX XAVIER)に実装され実験が行われる予定だそうです。
2020/11/17
Kaggleで地図に関連したコンペがローンチされています。
Human BioMolecular Atlas Program(HuBMAP)
地図と言ってますが、地理的地図ではありません。人体マップです。
人体マップといっても理科室にあるようなアレの類ではありません。
スポンサードしているのはNational Institutes of Health (NIH:アメリカ国立衛生研究所)。
このコンペでは細胞レベルで人体のオープンマップを作成することを目的としているそうです。
まずは腎臓器官から(Hacking the Kidney)……。
2020/10/29
VBA(Excel)でポリゴンの重心位置を求めてみます のExcelブックへのダウンロードリンクが間違っていましたので再リンクしました、ついでにGeoJSON作成のロジックに一部不具合がありましたので修正しました、失礼しました(ご指摘のユーザー様、ありがとうございました)。
2020/10/16
新しいKaggleのコンペのご紹介、アメリカン・フットボールです。
アメリカンフットボールで最もエキサイティングなプレーの中には、クォーターバックがロングパスでドロップバックするときがあります。 ボールが空中を飛ぶとき、何が起こるかを予測することはできませんよね、それともできます?
このコンペでは、NFLの次世代統計データを使用します。このデータには、各プレー中のフィールド上のすべてのプレーヤーの位置と速度が含まれます。 2018年のレギュラーシーズンのすべてのドロップバックパスプレーのプレーヤー追跡データを使用して、ディフェンシブな結果を予測します。 オープンなコンペと大学の参加者向けのコンペがあります。
2020/09/29
Kaggleでこういうコンペが始まってます。
Google Research Football with Manchester City F.C.
グーグルとマンチェスターシティが共同で始めたコンペで、Google Researchの環境でゲームをしながら強化学習でAIエージェントを鍛えてくれってことかな?コンペで優勝したらシティに招待しくれるようです(^^)。アグエロやスターリングに会えるかもしれませんよ、食野がいないのは残念だけど…..。
2020/09/19
経路探索で、「歩道のみ通りたいのに、歩道ー>車道ー>歩道みたいな経路になっている」というのを回避してみます。
ラズパイで経路探索ーpgRoutingの構成ファイル(XML)について
2020/09/05
使用するデータを変更しました。
ラズパイ(Ubuntu 20.04 LTS Server)で空間データベース
より一般的な使用に対応するためです。
2020/08/08
これも少々古い記事ですが、動作確認などが終わったので公開しました。
2020/08/06
少々古い記事ですが、動作確認などが終わったので公開しました。
ビット・トレード・ワンのGPSCAPを使ってみました。
2020/07/31
内容をちょっと変更
OSMタイルサーバーにしたラズパイをWi-Fiのアクセスポイントにしてみる(改)
create_apがメンテ停止になっていたようです(知らなかった)。
なのでアクセスポイントの設定方法を変更しました。よろしくお願いします。
2020/07/26
ラズパイのUbuntu 18.04 ServerにFirefoxをインストールして他の端末からブラウズしてみる
タイトルが変わった分、内容もちょっと変わっています(URLは一緒ですが)
2020/06/24
OpenStreetMapを使ったタイルサーバーについていろいろ公開できるようになりました。
Google MapsのAPIがなにかと扱い辛くなっている今日この頃、WisteriaHillは脱Google APIに向けていろいろ目論むことにしました。
Excelを使ったアプリについて脱Google版を作成する予定です。
よろしくお願いします。
2020/04/30
「火星ローバーに地形の判別方法を教えてあげましょう!」というプロジェクトが公開されていました。
日本語解説(Youtube)
「火星の地形をローバーに学習させるディープラーニング用のアノテーション・データセットをみんなでつくろう!」
ということだそうな。
面白そうだから参加してみちゃあどうでしょう。
公式ページの「Get started」から入って、登録すればOK。
2020/04/18
【朗報】 ガンバ大阪のホームである「パナソニックスタジアム吹田」が2020年度の日本建築学会賞を作品部門で受賞したそうな。めでたいのう(^^♪
当サイトではかつてこのスタジアムの3Dモデルを作ってみたことがあるので感慨深いです。
こんな感じのスタジアムです、ご覧ください。
2020/04/03
【朗報】「ABC予想」を証明した京大数理解析研の望月新一教授の論文が学術誌に掲載されることになったそうです。査読は終わったってことかな?「宇宙際タイヒミューラー理論」(IUT理論)についての本を以前読んだときは、サッパリ分からんなりに刺激的だったのを覚えてます。かつてブログで書いたのが2012年の9月ごろのことだから9年もたってるのね。論文なり解説本なりを一読されることをお勧めします。
たし算とかけ算について再考することを要求されてるんだけど、「サッパリ分からない!」とはこういうことかぁ…..という驚きを体験できます(^^)。論文にチャレンジしたい真摯(or物好き)な方はこちらからどうぞ。
2020/03/13
コロナウィルスの流行曲線を「可能な限りフラットにする」ことの重要性
「Covid-19の3つのフェーズ–そしてそれをどのように管理可能にするか(抜粋)」の項を追加
例によって、お下手な訳ですが大体の意味はつかんでいただける……かも。
*2020/04/08 ちょっとだけアップデート
2020/03/09
これは驚きの技術ですね。
Webカメラの映像からリアルタイムで人物を消去しています。完成形ではなく実験段階(ラボレベル)だそうですが、カメラ越しに透明人間を見てるみたいです。
Googleのエンジニアが開発してGitHubで公開されています。
TensorFlow.jsを使っているそうです。
2020/02/28
TellusがVer2.0にアップデートされました。
新しくマーケットプレースも追加され、データやアプリの売買などの「小商い」もできるようになったようです(^^)。
2020/02/18
「丁香園」(DXY.cn)のCOVID-19情報
ネットワーク解析とGISに基づく新しい冠動脈肺炎の集合的伝播の主要なリスクポイントの早期特定
動画は中国語なので何言ってるのかサッパリですが、スライドで漢字を拾っていけば雰囲気(?)は分かります(^^),
それでもいいという方はごらんください。
2020/02/01
新型コロナウイルスのリアルタイム・マップについては拡張用に別ページに移動しました。
Novel Coronavirus (2019-nCoV) リアルタイム・マップ
2020/01/24
Jetson NanoでOpenPoseを使ってみるをアップデートしました。
論文サマリーの日本語訳とか、データ採取コードのところなど……。
2020/01/15
当サイトは常日頃から粘菌さんの動向に注視しております(南方熊楠とはちょっと違う意味で)。
あんなんやら、こんなんやら…
最短経路なら粘菌アルゴリズム、粘菌アルゴリズムによる避難経路の導出と評価
巡回セールスマン問題ならモジホコリ
粘菌ネットワークを用いた時間枠制約付き巡回セールスマン問題の解法
粘菌の経路探索もサッカーのフォーメンション検出も内部のアルゴリズムに「輸送コスト問題」を含んでいるのは興味深いです。
2020/01/13
最短距離検索 – GIS教材に道路ネットワーク(道路グラフ)作成の項を2つ追加しました
2020/01/08
QGISとWeb連携(Leaflet、OpenLayers、Mapbox)
Leaflet版でカスタマイズの項を追加しました。
2019/12/27
すごいですね、プロサッカークラブがこういうカンファレンスやってるんですね。
バルサ(のカンプ・ノウ)で開かれていたFC Barcelona Sports Analytics Summitで発表された論文のサマリーです(本編は間もなく公開してくれるそうなんですが……?)。
機械学習を使って、トラッキングデータを使用したチームフォーメーションの検出と分析に関するもの
ゲーム中にコロコロ変化するフォーメーションを検出・分類してみましょう
(翻訳版)
Using Data to Analyse Team Formations
(日本語版)
ゴール裏にいるわりにはサッカー分かってないんじゃない..?という管理人のようなサポには有用かも。
Twitterで検索ー>ハッシュタグー>#BarçaAnalytics
ガンバさんにもこういうカンファレンスやってほしいです!!
2019/12/25
今年(2019)の京都大学の院入試の問題だそうです。
もう一度大学院で勉強し直そうとお考えの方!…..ご参考までに(過去問)。
ついでにこのページも(^^)。
2019/12/17
Tellus「自治体系地域統計データ」が公開されています。
地域経済分析システムRESASの自治体系のデータです。
DBはPostgreSQL、かなり細かいデータです。
機械学習のための数学の教科書が公開されていました (出版前!?)、mml-book.github.io
間違ってるとこがあったら教えてね…..だそうです。
興味のある方、どうぞ。Mathematics for Machine Learning(400ページ超え)
非常に基礎的な数学の教科書になっています(式が丁寧に追っかけられています)が、これで勉強しようとお思いの方は正誤表が付いた出版後の方がいいと思います。また、「機械学習やりたいんですけど…!」という方はPart IIからPart Iへ逆読みすればいいです。
2019/12/14
Azureを使うかどうかは別として、新しめのアルゴリズムも外観できます。
2019/11/30
Tellus 「衛星画像による海氷と船舶の識別、上位入賞者3名の解析手法について解説」(SIGNATEではなくKaggle)
2019/11/12
Google Maps 標高 (SRTM版)がHTTPS対応から漏れていてトラブっていました、修正しました、失礼しました。
2019/10/29
Tellus Satellite Challenge (KaggleではなくSIGNATEのコンペ)
船舶の物体検出!第2回衛星データ解析コンテスト上位入賞者の解析手法紹介!
GISについて知っとくとデータの前処理に役立つかも….GIS教材
2019/10/26
産総研のOpenVSLAMがフランスで開催中の国際会議Multimedia 2019 でのオープンソースソフトウェアコンペティションで1等賞(1st place)を取ったそうです(^^)。
GitHubで公開されています(BSDライセンス)。SLAMって何?
Ubuntu 18.04 + THETA Vでも動作するようです、Jetson Nanoでもいける?
THETA Sを使う場合は、Dual Fish EyeをEquirectangularに変換するひと手間がいりますね。
2019/10/08
ビデオで使っているPythonコードを添付しました。
2019/10/04
筑波大学オープンコースウェア(TSUKUBA OCW)で無償公開されている機械学習講義(全20回)
理論ベースですが今時の内容なので面白い、自分で講義ノートを作ると勉強になります、さぼらず宿題もやりましょう(^^)。
2019/09/30
テルース(Tellus)が ver 1.2 になりました。
2019/09/08
WisteriaHillではGoogle Mapsの運用で「月額課金0円」を目指して、1日あたりのアクセス上限を調整中です。Mapsで「このページでは Google マップが正しく読み込まれませんでした。」が表示された場合は上限に達した可能性があります。日を改めてアクセスしてみてくださいませ。よろしくお願いします。
2019/08/31
若干アップデートしました、Jetson Nano(ubuntu 18.04 LTS Python 3.6.8)の環境でも試せます。
Theanoを使った例
数字を分類するニューラルネットワークの実装をやってみる2-3
2019/08/14
3Dの世界地図を作成するプロジェクト「EarthDEM」
スーパーコンピューター「Blue Waters」を使って、人工衛星が撮影した無数の衛星写真を分析し、異なる角度で撮影された写真の視差から高さを計算して3Dデータを構築するというもの。
北極や南極だけでなく地球全土を網羅することが予定されているそうです。
2019/08/07
1枚のイラストからアニメーションを生成(DeepAnime)
GANを使ったAIプロジェクトですが、これも面白いですけどむしろこの会社(AlgoAge)のチームスタッフのキャリアと製品ラインアップが今時すぎて、すごいですね。
2019/07/27
Facebook製のAIを使って衛星画像などから地図を作成する「Map With AI」
完成品は出来ないけど、人力をサポートして作成期間が1/3位に短縮できるそうです
また、Kaggleで「くずし字認識」のコンペがローンチされていました。Kaggleでは初の人文系コンペだそうです。
Prize Moneyは、$15,000です!First Prize: $3,000、お金につられていかがでしょう(^^)。
Googleのランドマーク認識のコンペの6倍……….(TT;
2019/07/24
「一般相対性理論を一歩一歩数式で理解する」の正誤表のリンク先が変更になっていましたので訂正しました。
2019/07/16
Movidius NCSのNCSDK1のインストール方法が変更されていました。
更新しました、ラズベリーパイ3 Model Bに Movidius NCS の環境をセットアップ
2019/07/10
この方のブログが面白すぎたのでリンクしときます。あたまが固くなりかけたら再読します。
基礎って大事よねぇ….という話。
2019/06/20
ラズベリーパイ3で顔認識の所見で少々勘違いがあったので訂正しました。
ついでに、OpenCVも日本語化してみました。
2019/05/24
Wolfram Engineが開発者向けに無償開放されています。
Wolfram Cloud Basicのライセンスも含まれていて、知識データベース“Wolfram Knowledgebase”へもアクセスできるそうです。
2019/03/03
2018/09/25に報告していたExcelの新機能、Insert Data from Picture(Android版のExcel)が
2019年3月についにアプリに実装されました。
こんな感じ
2019/01/21
複数ラズパイでP2pアドホックネットワーク(メッシュネット)によるブロックチェーンの実装
2018/09/25
Excelがアップデートされ、AIを活用した4つの新機能が追加されました。サイトとしてはこの機能に注目->New data types、Insert Data from Picture
New data typesの記事によれば….
株式や地理から始まる現実の概念を認識することができます。
この新しいAI機能は、単一のフラットなテキストを豊富な情報のレイヤを含むインタラクティブなエンティティに変換します。
たとえば、ワークブック内の国のリストを「地理」エンティティに変換することにより、顧客は自分のデータの分析に位置データを織り込むことができます。
いまいち分かりづらいですね。
株価情報と地理データ(2018年10月公開予定)をご参照ください。
Insert Data from Picture(Android版のExcel)
AIを活用した画像認識機能により手書きの書類などをカメラで撮影するだけで、自動でスプレッドシート上に情報を入力することができるようになります。
2018/09/06
Googleがデータセット検索サービスのベータ版を公開しています。
2018/08/20
ニューラルネットワークの実装をスクラッチからやってみる
数字を分類するニューラルネットワークの実装をやってみる2-1
数字を分類するニューラルネットワークの実装をやってみる2-2
Theanoを使った例
数字を分類するニューラルネットワークの実装をやってみる2-3
以下の環境で実行できるようにしました
ubuntu 16.04 LTS + Python 3.x
(ubuntu 18.04 LTSがリリースされていますが、注意点はPython 2はデフォルトでインストールされなくなり、Python 3 は3.6になります….ということ)
TensorFlow/Caffeをubuntu 16.04 LTS へインストールのCaffeをPython3.5へ対応
2018/07/13
永らく謎のままだったMagic Leapが、今年(2018)後半に「Magic Leap One」をリリースするようです。
期待しましょう(でも期待値と現実の落差がアレだったジンジャー = Segwayのようにはならないでね)。
2018/06/16
Litecoinのソースへのリンクが変更されていたので修正しました。
2018/05/24
WebVRのモバイル版カードボード表示がChrome(66)の場合少し変ですね、センサーの反応が敏感すぎるというか….。安定していません。
Chrome67でVR対応を強化するための66特有の一過性の問題?
65でもセンサーに反応しないようです。最新バージョン(2.0.2)のライブラリーでも結果は同じですね。
ちなみにバージョン64のAndroid版Chromeでは無問題でした。
他に、Galaxyのブラウザー(6.4.10.5)やOpera(46.3.2246.127744)でも無問題でしたし、SafariでもOKだそうです。
Firefoxは相変わらずペケ。
(設定->アプリ->メニュの標準アプリ->ブラウザアプリでデフォルトで起動するブラウザーを変更できます)
2018/05/03
Google Maps 標高表示をアップデート
Google API,SRTM,国土地理院APIの3つに対応しました。
日本国内に関しては国土地理院APIが最も精度が高いはずです。
2018/04/30
地形データの作成方法を変更しました。
SketchUpとGoogleMapsを使った方法は(多分契約上の問題で)使えなくなりました。WisteriaHillでは国土地理院のデータサービスを使った方法に変更します。
地理院データはずいぶん使いやすくなりましたし、今後標高データもアップデートされて精度も向上するようです。6年後(2024頃?)に公開されるそうなので、この頃にWisteriaHillも国内の標高データはSRTMやGoogle APIから変更する予定です。(ただ、国土地理院の地図は建物などの表示 はダサイです->見づらい->一覧性の表現力が低い)
2018/03/11
Google VR Viewでホットスポットを使ってみる(on the web)
2018/02/16
現在、一部のページでGoogle Mapsの表示に不具合が出ています。
どうもGoogleの利用規約が厳しくなった(?)みたい。
順次対応しています、ご了承ください。
2017/12/30
Google VR Viewは、ubuntu 16.04 LTSの環境だとFirefox Quantum(57.0)でも動作します….ちょっと意味が分からなくなりました(^^)。FirefoxのJavaScriptエンジンはどうなっているのでしょう?
2017/12/27
Google VR ViewをスマホやCardboardで観てみる
Google VR View Sample にQRコードを表示
Chromeブラウザで表示すれば、スマホやCardboardでVRを観れます。
2017/12/25
Google VR View関連ページがブラウザーによっては不具合がでるようです、これはVRDisplay関連の仕様が各ブラウザーによって互換性が保たれていないのが原因のようです(多分)。
Firefoxなどは54.x以前のバージョンなら動きます。
推奨できませんが参考までに古いバージョンのFirefox
〇 Google Crome 、IE11、FireFox(<=54.x)
X FireFox(>=55.x)、Edge、Safari
?Opera
2017/09/17
Hyperlapse関連のページをリニューアル+追加しました。
HYPERLAPSEで検索してみてください。
進行中のプロジェクト
●WebVR
Google VR ViewにWisteriaHill的APIを追加実装
少々お高いですがViveやOculusが手に入ったらSupermediumにもチャレンジ
●OpenStreetMap
mapboxってどこまでできるの?
●Illustrated Map
イラストマップと実マップを接続するメソッド(現バージョンを改造)
●P2P
経済原則をプロトコルレイヤーとして持つネットワークアーキテクチャーってやつ?
●AI
このサイトってことで、地図に絡めた画像認識が中心になるでしょう。
ランドマーク認識の試みなどはGoogleなんかがとっくにやってることなんで置いといて(Kaggleでチャレンジしてみるのもいいかもしれませんが)、もっとローカル & プライベートな、あるいは小規模グループな領域になるでしょう。個人の記憶に関わる部分とかグループ内の意思決定の部分とか……….(クラウド上ではなくONNXのようなものを使ったエッジ上での処理)。
AIについてはこういうのを見るとちょっとびっくりする。
WisteriaHill的解釈
AI = Artificial Intelligence = 人工知能と考えると違和感がある。
AI ≒ Augmented Intelligence = 拡張知能…..の方がなんか腑に落ちる(今はそこまで行ってないけど)。
●Alfred North Whitehead as Project
●Henri-Louis Bergson as Philosophy
●Avram Noam Chomsky — 言語
Tweet
2018/01/20
Bitcoin,Ethereumの実験でなんとなく分かってきたこと
単なるP2Pで送金をしてもそれは「ただの」データ送信。
「マイニング」というブロック生成があるから「ただの」データ送信が「通貨」というスキームを構成することになる。
マイニングにインセンティブがあるので「やり続ける」気になれる。
ブロックチェーンがアクティブに「動き続ける」システムであるという構造がなんとなく分かってきた気がする。
報酬のあるトレッドミル?
まあ、後の世に評価された大半のものは、最初は批判や否定から始まっているのを思い起こすのは有益かも。
「マイニング」を人間系から、機械系のみの完結型へ移行しようとすると「報酬」と「ペナルティ」という2つの概念が重要になる?
SSL対応状況について
ちょっとずつ対応していますが、遅れています。ご了承ください。
さすがにトップページは以下でアクセスできます。
https://wisteriahill.net
過去サイト
Links
地図系プロジェクト
古地図コレクション(David Rumsey Historical Map Collection)
OSGeo財団((The Open Source Geospatial Foundation))
Earth系プロジェクト
日本列島がいつごろできたのか確認してみましょう(単位はmillionなんでx 1000,000)
1900年以降の地球表面の温度変化を見てみる
AI系プロジェクト
サンタ追跡プロジェクト
お問合せ